本 书签 着 


] 帐 


宋 天 龙 是 中 国 新 生 代 的 网 站 数据 分 析 界 “大 拿 ” 的 代表 ， 其 对 网 站 数据 分 析 的 理解 是 行业 中 数一数二 的 。 他 把 他 对 网 站 数据 分 析 的 前 释 和 领会 一 览 无 余地 吐露 在 本 书 中 ， 并 分 四 篇 深入 浅 出 地 讲述 了 从 
企业 数据 体系 建设 之 初 ， 到 网 站 分 析 工 具 的 选择 与 部 署 ， 再 到 实际 案例 分 析 ， 最 后 收尾 于 其 对 网 站 数据 分 析 的 升华 与 提高 ， 尤 其 是 引人入胜 的 第 15 章 对 网 站 数据 分 析 的 投入 与 产 出 的 分 析 ， 更 是 充分 展示 了 
宋 天 龙 对 网 站 数据 分 析 游刃有余 的 拿捏 。 据 此 ， 我 推荐 任何 刚 入 门 及 所 有 对 网 站 数据 分 析 感 兴趣 的 朋友 来 学 习 和 阅读 ， 如 果 可 能 ， 与 栗 天 龙 一 起 切磋 和 提高 。 


张 妹 Webtrekk 亚 洲 区 市 场 总 监 
这 是 一 本 写 网 站 数据 分 析 的 专业 书 ， 有 思路 ， 有 分 析 方 法 ， 有 分 析 工 具 讲 解 和 案例 剖析 。 推 荐 数据 分 析 、 网 站 运营 等 人 士 阅 读 。 
黄 成 明 (@ 数 据 化 管理 ) 数据 化 管理 的 咨询 顾问 及 培训 师 


很 早 就 认识 天 龙 ， 第 一 次 正式 认识 是 通过 我 的 一 篇 博文 ， 他 的 评论 来 源 于 有 见地 的 实践 。 与 其 他 网 站 数据 书籍 不 同 的 是 ， 本 书 既 强调 工具 和 技术 ， 又 重视 意识 和 应 用 ， 尤 其 融入 了 很 多 大 型 企业 的 宝贵 
经 验 。 他 把 统计 学 、 数 据 挖 气 、 自 动 化 应 用 等 方法 应 用 其 中 ， 这 是 对 网 站 数据 工作 方法 的 延伸 ; 同时， 对 于 数据 工作 的 完整 认 知 和 数据 管理 意识 ， 更 是 丰富 了 网 站 数据 工作 的 广度 与 深度 。 因 此 ， 这 是 一 本 
不 可 多 得 的 佳作 。 


宋 星 ” 阳 狮 锐 奇 (Publicis Groupe VivaKi) 数据 解决 方案 总 经 理 


数据 分 析 = 技 术 + 市 场 + 战略 ， 这 就 决定 了 数据 分 析 在 企业 中 的 重要 性 ， 我 们 需要 借助 数据 来 指引 决策 ， 而 不 是 随机 拍 脑 袋 ! 传统 行业 的 决策 过 多 依赖 于 管理 者 的 眼光 和 洞察 力 ， 而 数据 分 析 人 要 做 的 事 
情 ， 就 是 把 这 些 眼 光 和 洞察 力 转 化 为 可 量化 的 数字 信息 ! 同时 数据 的 竞争 在 于 数据 采集 的 竞争 ， 在 于 数据 维度 的 竞争 以 及 玩 转 数 据 的 人 ， 再 好 的 数据 没有 优秀 的 数据 人 员 进 行经 莒 及 挖掘 ， 其 价值 终究 无 法 
展现 。 推 荐 阅读 天 龙 撰 写 的 此 书 ， 本 书 很 好 地 阐述 了 如 何 进 行 企业 级 数据 运营 及 数据 分 析 工 作 ， 对 于 准备 了 解 及 从 事 数据 分 析 工 作 的 人 有 非常 大 的 帮助 。 


田 学 峰 。 萝 下 教育 网 创始 人 


如 何 定 位 及 发 现 数据 中 的 价值 是 网 站 分 析 中 最 受 关注 的 问题 。 宋 天 龙 通 过 多 年 的 从 业经 验 给 出 了 答案 。 本 书 从 数据 的 认 知 到 数据 的 应 用 ， 以 丰富 的 案例 由 浅 入 深 地 讲解 了 数据 在 商业 中 的 作用 及 价值 。 
无 论 你 是 数据 行业 的 新 人 ， 还 是 有 一 定 实践 经 验 的 从 业者 ， 这 都 是 一 本 不 应 该 错过 的 好 书 。 


王 摩 平 “网 站 分 析 爱 好 者 《网 站 分 析 实 战 》 作 者 之 一 
对 于 每 一 位 网 站 分 析 师 来 讲 ， 这 是 本 必须 买 和 必须 认真 读 的 书 。 
第 一 次 读本 书 时 ， 就 被 书 中 宽广 的 知识 视角 和 清晰 的 阐述 所 折服 ， 这 完全 是 源 于 作者 极其 丰富 的 实战 经 验 ， 以 及 对 产品 和 技术 孜孜 不 倦 的 追求 。 
宫 侈 ”射手 学 院 创 始 人 


中 国 网 站 分 析 的 圈子 其 实 不 大 ， 我 和 天 龙 也 一 直 相 望 于 江湖 。 他 从 业 时 间 很 长 ， 使 用 过 各 家 主流 的 分 析 工 具 ， 亦 有 着 从 事 大 型 电 商 数据 管理 工作 的 经 验 ， 实 属 不 多 见 的 实战 派 人 才 。 天 龙 是 一 个 严谨 的 
网 站 分 析 工 作者 ， 正 如 他 所 理解 的 那样 ， 在 这 个 领域 里 很 多 人 是 一 只 起 膀 的 乌 儿 ， 要 么 执着 地 偏向 分 析 技术 ， 要 么 急躁 地 追求 数据 价值 。 网 站 数据 分 析 是 一 条 漫长 的 路 ， 它 隶属 于 一 个 细 分 研究 领域 ， 却 涉 
猎 广 博 、 变 化 极 快 。 希 望 这 本 书 能 够 带 给 你 一 个 新 的 角度 ， 从 而 帮助 你 站 到 一 个 新 的 高 度 。 


王晓东 TrueMetrics 创 始 人 


互联 网 的 发 展 日 新 月 异 ， 企 业 要 想 有 所 作为 ， 必 须 打 造 完善 的 数据 跟踪 、 分 析 和 优化 体系 。 网 站 数据 分 析 区 别 于 传统 的 业务 分 析 ， 会 涉及 数据 跟 中 机制、 数据 分 析 建 模 层 面 ， 也 区 别 于 数据 挖掘 ， 会 有 
数据 与 业务 结合 的 层面 。 此 书 深入 浅 出 地 介绍 了 网 站 数据 分 析 的 原理 和 实际 案例 ， 是 行业 内 不 可 多 得 的 开山 之 作 。 无 论 是 对 于 互联 网 数据 分 析 相 关 从 业 人 员 ， 数 据 分 析 专 业 人 员 ， 还 是 管理 者 ， 本 书 都 是 不 
可 多 得 的 好 书 。 优 秀 的 人 出 优秀 的 书 ， 强 烈 推 荐 ! 


胡 力 “Netconcepts 深 圳 分 公司 总 经 理 《流量 的 秘密 (第 3 版 ) 》 审 校 
无 论 是 互联 网 还 是 传统 公司 都 越 来 越 意识 到 数据 资产 和 数据 分 析 的 重要 性 ， 但 很 多 公司 对 如 何 利用 数据 创造 价值 和 基于 数据 做 决策 存在 一 些 疑惑 。 


本 书 作者 基于 自身 的 行业 经 验 和 理论 ， 从 数据 的 价值 、 如 何 收集 数据 ， 到 如 何 形成 数据 决策 和 数据 驱动 的 体系 一 层 层 地 回答 了 企业 线 上 营销 和 线 上 运营 等 维度 的 数据 分 析 问 题 。 无 论 是 对 职业 的 数据 分 
析 师 、 数 据 分 析 入 门 者， 还 是 企业 管理 人 员 ， 本 书 都 不 失 为 既 有 理论 深度 又 有 较 高 实践 性 的 优秀 之 作 。 


李 俊 百度 大 数据 部 高 级 产品 经 理 


为 什么 要 写 这 本 书 
随 着 中 国 商 业 精细 化 运营 价值 的 凸显 以 及 企业 对 数据 价值 认可 度 的 提高 ， 网 站 数据 分 析 正 变 得 炙手可热 ， 尤 其 在 互联 网 企业 中 ， 网 站 数据 分 析 已 经 成 为 从 业 人 员 必 备 的 一 项 职业 技能 。 
但 在 对 网 站 数据 进行 分 析 的 过 程 中 ， 我 发 现 企业 中 普遍 人 存 在 三 类 问题 ， 本 书 就 致力 于 帮助 读者 解决 这 三 类 问题 。 
第 一 类 是 数据 工作 者 的 认 知 问题 。 


纵 观 当前 与 网 站 数据 相关 的 从 业者 ， 或 多 或 少 都 会 存在 以 下 两 种 认 知 : 第 一 种 是 技术 论 ， 这 种 观点 的 核心 是 关注 数据 部 署 和 采集 、 数 据 工 具 、 技 术 、 模 型 的 重要 性 而 忽略 了 应 用 场景 ; 第 二 种 是 业务 
论 ， 这 种 观点 只 关注 应 用 层面 的 业务 问题 ， 由 于 缺乏 对 数据 前 端 处 理 的 把 握 和 专业 技术 、 工 具 的 支持 ， 叶 致 后 期 数据 质量 和 应 用 都 缺乏 可 靠 依 据 ， 最 终 影响 了 数据 价值 的 提炼 及 应 用 效果 的 提升 。 


以 数据 价值 为 导向 的 数据 分 析 师 应 该 具备 以 下 素质 ， 这 也 是 贯穿 本 书 的 核心 思想 : 
.一 是 立足 于 数据 本 身 的 追 本 溯源 。 数 据 分 析 师 需要 了 解数 据 的 整个 工作 链 ， 从 数据 的 产生 、 采 集 、 存 储 、 提 取 、 挖 据 、 分 析 、 展 现 到 集成 应 用 ， 并 能 在 各 个 环节 有 独到 的 见解 。 
二 是 着 眼 于 数据 应 用 价值 的 研究 。 研 究 数据 如 何 能 更 智能 化 、 可 视 化 、 自 动 化 ， 以 及 如 何 更 有 价值 地 解决 业务 问题 并 带 来 业务 价值 的 直接 提升 。 


不 得 不 说 ， 技 术 是 实现 商业 理解 的 必要 保证 。 网 站 数据 分 析 的 传统 方法 是 趋势 、 细 分 和 转化 ， 但 仪 有 这 些 方法 还 不 够 ， 很 多 深层 次 的 问题 需要 借助 其 他 方法 来 实现 ， 例 如 数据 挖掘 、 统 计 学 、 人 工 智 


能 、 商 业 智 能 等 。 我 从 来 不 认为 网 站 数据 分 析 与 数据 工作 是 割裂 的 ， 它 是 数据 工作 的 一 部 分 ， 所 有 关于 数据 的 工作 方法 都 可 以 和 网 站 数据 结合 使 用 。 但 可 惜 的 是 ， 当 前 将 网 站 分 析 与 其 他 数据 工作 方法 结合 
起 来 的 较 少 ， 因 此 ， 我 在 本 书 中 用 大 量 的 篇 幅 介 绍 数据 挖掘 在 网 站 分 析 中 的 应 用 案例 。 


第 二 类 是 数据 价值 的 认 知 问题 。 


对 于 任何 一 个 企业 来 说 ， 数 据 工作 都 不 是 企业 发 展 的 必需 条 件 ， 最 起 码 在 企业 运作 初期 没有 大 量 数据 的 情况 下 企业 同样 可 以 快速 帮 展 。 这 时 我 开始 思考 数据 的 价值 到 底 是 什么 ”数据 到 底 能 给 企业 带 来 
什么 ? 如 果 没有 数据 企业 又 会 损失 什么 ?归根结底 ， 数 据 存 在 的 意义 是 用 来 解决 商业 问题 的 ， 换 句 话 说 数据 能 给 企业 带 来 多 少 价值 ， 以 及 这 些 价值 是 如 何 体 现在 企业 的 利润 报表 里 面 的 。 作 为 网 站 数据 分 析 
应 该 如 何 带动 企业 的 业务 成 长 ,或 者 如 何以 单独 的 形态 与 业务 结 成 依存 关系 最 终 实现 自我 价值 。 这 些 问题 是 需要 讨论 的 。 未 来， 数据 的 作用 将 主要 着 眼 于 基于 数据 驱动 和 系统 智能 工作 机 制 ， 而 辅助 决策 工 
作 将 成 为 数据 的 一 个 非 主 要 应 用 。 所 以 本 书 在 案例 篇 中 重点 介绍 了 基于 数据 驱动 的 营销 和 运营 应 用 ， 其 目的 便 在 于 此 。 


第 三 类 是 如 何 从 企业 的 角度 做 数据 工作 管理 的 问题 。 


作为 初 、 中 级 分 析 师 ， 主 要 工作 职责 是 把 数据 本 身 或 数据 项 目 工 作 做 好 ; 但 作为 管理 层 的 高 级 分 析 师 或 管理 者 ， 需 要 思考 的 问题 不 仪 是 如 何 完成 工作 ， 还 包括 如 何 建立 企业 数据 架构 、 数 据 工 作 流程 、 
数据 应 用 体系 、 数 据 风险 以 及 质量 管理 体系 ， 这 是 站 在 企业 的 高 度 来 思考 数据 的 定位 及 布局 的 必 经 之 路 。 


基于 以 上 三 类 问题 ， 我 萌生 了 写本 书 的 想法 ， 目 的 是 希望 读者 能 够 放 开 眼界 ， 首 先 破 除 网 站 数据 的 局 限 性 ， 其 次 破除 数据 的 局 限 性 ， 最 终 站 在 企业 的 角度 思考 问题 。 作 为 一 本 接地 和 气 的 书 ， 书 中 列举 了 
大 量 案例 并 通过 对 每 个 案例 的 详细 介绍 来 帮助 读者 进行 案例 式 的 学 习 ， 和 希望 能 带 给 读者 一 些 新 的 理解 、 观 念 和 应 用 思路 ， 使 其 无 论 是 在 工作 机 会 的 选择 上 还 是 收入 上 都 能 获得 较 大 的 帮助 。 


读者 对 象 
本 书 适合 以 下 几 类 从 业者 阅读 。 


“ 对 数据 研究 感 兴趣 的 在 职 人 员 。 无 论 你 从 事 什么 工作 ， 如 果 你 能 够 将 数据 的 思路 、 价 值 和 应 用 方法 结合 到 你 的 工作 实践 中 ， 一 定 会 对 你 现 有 的 工作 有 所 帮助 。 数 据 化 思维 和 工作 能 力 已 经 成 为 每 个 在 


职 人 员 的 加 分 项 。 


: 刚 入 数据 行业 的 新 人 人。 如果 你 是 一 位 刚 入 行 的 新 人 人， 一定 希望 能 够 有 一 本 兼 具 实战 和 理论 高 度 的 书籍 ， 从 全 局 到 局 部 的 每 个 细节 为 你 理 清 工作 思路 并 明确 职业 成 长 方向 。 如 果 你 要 了 解数 据 在 企业 内 
的 价值 、 工 作 流 程 ， 同 时 想 快 速 融 入 企业 并 得 到 领导 的 赏识 ， 那 么 本 书 绝 对 适合 你 。 


. 已经 具备 一 定 实践 经 验 的 数据 从 业者 。 对 于 已 经 在 数据 方面 工作 1~3 年 的 从 业者 ， 相 信 你 们 会 面临 一 些 瓶 颈 ， 并 想 要 在 原 有 数据 思维 的 基础 上 获得 更 有 效 的 工作 方法 和 工作 价值 的 提升 。 本 书 中 丰富 
的 应 用 案例 可 以 帮助 你 拨 开 云雾 见 青天 。 


: 已 经 具有 丰富 工作 经 验 的 数据 从 业者 。 当 数据 从 业者 工作 3 年 或 3 年 以 上 时 ， 就 已 经 有 机 会 从 执行 层 走 向 管理 层 了 。 机 会 总 是 留 给 有 准备 的 人 的 ， 作 为 管理 者 如 何 从 数据 工作 流程 、 制 度 、 风 险 和 绩效 
方向 进行 思考 并 开展 工作 呢 ? 相信 本 书 会 给 你 满意 的 答案 。 


如 何 阅读 本 书 
本 书 的 正文 内 容 分 为 四 篇 ， 按 照 数 据 工作 的 成 长 思路 来 撰写 ， 每 篇 都 对 应 着 一 个 成 长 阶段 。 


认 知 篇 ， 介 绍 网 站 数据 分 析 在 企业 内 的 价值 体现 ， 以 及 如 何 建 立 个 人 的 数据 成 长 体系 、 企 业 数 据 职 能 架构 与 数据 价值 最 大 化 的 定位 。 本 篇 的 目的 是 帮助 读者 快速 了 解 企业 内 部 的 整体 数据 架构 、 网 站 数 
所 分析 所 扮演 的 角色 以 及 个 人 在 企业 中 如 何 进 行 自我 定位 和 发 展 。 


基础 篇 ， 分 别 介绍 了 网 站 数据 的 采集 和 配置 、 网 站 分 析 工 具 的 选择 、 网 站 数据 整合 的 方法 、 数 据 监测 与 评估 指标 以 及 数据 分 析 场 景 和 方法 。 这 些 知 识 是 进行 数据 分 析 的 基本 前 提 ， 其 中 的 第 7 章 和 第 8 章 
直接 以 业务 场景 为 切入 点 ， 这 部 分 知识 可 直接 应 用 到 实际 工作 中 。 


案例 篇 ， 以 与 网 站 分 析 结 合 最 为 紧密 的 营销 和 网 站 运营 为 例 ， 分 别 介绍 了 网 站 数据 的 辅助 决策 以 及 数据 驱动 的 工作 内 容 ， 通 过 十 多 个 案例 还 原 数据 分 析 的 实际 场景 ， 这 些 案 例 可 以 套用 到 实际 工作 中 并 
直接 发 挥 作用 。 


提高 篇 ， 从 数据 管理 者 和 领导 者 的 角度 介绍 数据 风险 、 数 据 质量 、 数 据 投入 与 产 出 、 数 据 流程 与 落地 管理 ， 这 些 都 是 作为 数据 管理 者 自我 提升 的 必 备 知识 。 
除 正 文 内 容 外 ， 本 书 还 提供 了 两 个 附录 。 


附录 A 是 关于 网 站 分 析 工 具 中 三 个 典型 工具 的 特性 的 具体 介绍 ， 包 括 Webtrekk (主要 是 Q3) 和 Adobe Analytics (主要 是 Sitecatalyst) 的 默认 报表 和 指标 ， 以 及 Universal Analytics 的 通用 和 自 定义 代 
码 的 部 署 示例 。 


附录 B 总 结 了 关于 网 站 数据 工作 的 局 限 与 发 展 ， 从 网 站 数据 的 价值 、 认 知 和 技术 局 限 性 来 阐述 其 所 面临 的 挑战 ， 展 望 了 未 来 数据 发 展 的 三 个 方向 : 整合 化 、 智 能 化 、 可 视 化 。 
勘误 和 支持 


由 于 作者 的 水 平 有 限 以 及 编写 时 间 仓 促 ， 书 中 难免 会 出 现 一 些 错误 或 者 不 准确 的 地 方 ， 晨 请 读者 批评 指正 。 为 此 ， 作 者 特意 创建 一 个 QQ 和 群 以 方便 大 家 讨论 与 沟通 ( 群 号 : 127586352) ， 读 者 可 以 将 
书 中 的 错误 发 布 到 群 中 ;如 果 你 遇 到 任何 问题 ， 也 可 以 访问 http://www.searchmarketingart.com/ 并 在 “书籍 讨论 区 ”进行 提问 ， 我 将 尽量 在 线 上 为 读者 提供 最 满意 的 解答 。 书 中 的 全 部 源 文件 除 可 以 从 
该 网 站 “书籍 讨论 区 ”下 载 外 ， 还 可 以 从 华章 网 站 (www.hzbook.com) 下 载 ， 我 会 将 相应 的 功能 更 新 及 时 在 该 网 站 发 布 出 来 。 如 果 你 有 更 多 的 宝贵 意见 ， 还 欢迎 发 送 邮件 至 邮箱 : 
beijingtl@ gmail.com， 期 待 能 够 得 到 大 家 的 真诚 反馈 。 
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认 知 篇 


. 第 1 章 ， 科 学 地 认识 网 站 的 数据 分 析 
第 2 章 从 零 开 始 建立 企业 数据 体系 


- 第 3 章 “从 零 开 始 建立 数据 分 析 师 个 人 成 长 体系 


第 1 章 ”科学 地 认识 网 站 的 数据 分 析 
网 站 数据 分 析 的 相关 话题 正 随 着 中 国 互 联网 的 发 展 被 越 来 越 多 的 人 讨论 着 ， 但 其 中 关于 网 站 数据 分 析 基 本 认 知 层面 的 讨论 较 少 。 实 际 上 国内 对 网 站 分 析 的 认 知 水 平 仍然 处 于 较 低 的 层次 ， 表 现在 把 网 站 
数据 分 析 当 做 万 能 钥匙 ， 期 望 它 能 解决 任何 的 业务 问题 ; 或 者 对 网 站 数据 分 析 不 层 一 顾 ， 忽 视 数据 在 业务 优化 中 的 辅助 甚至 是 驱动 作用 。 


本 章 旨 在 引领 大 家 建立 一 个 全 面 的 网 站 数据 分 析 观 ， 向 大 家 介绍 网 站 数据 分 析 到 底 是 什么 ， 为 什么 企业 需要 网 站 数据 分 析 ， 它 能 解决 和 不 能 解决 的 问题 ; 同时 就 大 家 经 常 谈论 的 “数据 驱动 ”问题 展开 
讲解 ， 使 大 家 了 解 到 底 什 么 才 是 真正 的 数据 驱动 。 


1.1 企业 为 什么 要 对 网 站 的 数据 进行 分 析 

1.1.1 网 站 数据 分 析 能 为 “ 谁 ” 解 决 问题 
网 站 数据 分 析 面 向 的 对 象 是 公司 内 部 的 整体 运营 体系 ， 可 以 涵盖 公司 内 部 所 有 的 以 网 站 为 核心 的 上 下 游 相关 业务 主体 。 
1. 网 站 数据 分 析 能 为 公司 整体 运营 提供 战略 支持 


网 站 数据 分 析 的 支持 对 象 首先 是 公司 整体 。 网 站 数据 分 析 在 战略 支持 过 程 中 围绕 网 站 ， 重 点 围绕 网 站 营销 、 网 站 运营 、 网 站 用 户 、 网 站 产品 销售 等 业务 进行 趋势 和 战略 规划 ， 它 是 线 上 的 数据 核心 。 通 
过 对 网 站 本 身 整体 的 营销 情况 、 流 量 情况 、 销 售 情况 和 用 户 情况 的 挖掘 分 析 ， 并 结合 财务 数据 、CRM 数 据 、ERP 数 据 、OA 数 据 等 数据 形成 整体 数据 体系 和 关键 度量 ， 为 公司 高 层 战略 决策 的 制定 提供 基本 的 
数据 支持 。 


另外 ， 网 站 数据 分 析 还 能 通过 特定 的 方法 获取 整个 行业 及 其 竞争 对 手 的 相关 信息 ， 这 对 于 获取 关键 的 竞争 情报 ， 如 曹 销 推广 动向 、 产 品 销售 策略 、 网 站 设计 趋势 和 用 户 组 成 结构 等 都 有 至 关 重 要 的 作 
用 。 因 此 ， 它 也 是 战略 竞争 分 析 的 重要 组 成 部 分 ， 能 为 公司 高 层 战略 决策 的 制定 提供 行业 视角 和 竞争 情报 。 


通过 对 公司 内 外 部 数据 的 收集 和 整合 应 用 ， 结 合 公司 的 内 部 运营 和 外 部 行业 环境 ， 网 站 数据 分 析 能 为 企业 的 战略 制定 和 执行 优化 提供 较为 全 面 的 数据 视角 。 
2. 网 站 数据 分 析 能 为 各 业务 点 提供 数据 支持 


网 站 数据 分 析 面 向 的 业务 对 象 是 公司 内 部 与 网 站 有 关 的 支持 、 生 产 、 运 营 、 发 布 和 优化 等 部 门 。 按 照 公 司 内 部 的 职能 划分 ， 直 接 支持 的 对 象 通常 是 业务 类 部 门 ， 包 括 营 销 相关 、 运 营 相 关 、 销 售 相关 、 
产品 设计 、 用 户 体验 、 会 员 相 关 等 ;间接 支持 的 对 象 通常 是 职能 类 部 门 ， 包 括 HR、 财 务 、 行 政 管理 、 稽 查 等 。 无 论 是 业务 类 部 门 还 是 职能 类 部 门 ， 网 站 数据 分 析 的 作用 都 是 为 公司 提供 评估 、 优 化 、 审 核 、 
校 验 、 稽 查 等 相关 价值 点 ， 数 据 结果 会 反馈 给 相关 部 门 和 管理 人 员 进 行 公司 流程 梳理 、 部 门 执 行 优 化 、 个 人 发 展 绩效 等 环节 。 


1.1.2 ”网 站 数据 分 析 能 解决 哪些 问题 

网 站 数据 分 析 的 载体 是 网 站 ， 因 此 所 有 的 数据 都 来 自 于 网 站 本 身 。 而 数据 在 反馈 到 业务 的 过 程 中 ， 能 解决 的 问题 集中 在 与 网 站 相关 的 课题 上 。 网 站 数据 分 析 可 以 提供 多 平台 (不 同形 式 的 网 站 和 应 
用 ) 、 多 渠道 (不 同 的 营销 和 推广 渠道 ) 、 多 终端 (不 同 的 访问 终端 ) 下 多 数据 体系 的 数据 整合 分 析 ， 为 与 网 站 整体 营销 相关 、 运 营 相关 、 用 户 相 关 和 销售 相关 的 业务 提供 洞察 支持 。 

1. 多 数据 平台 的 数据 整合 分 析 


大 多 数 企 业 都 有 多 个 企业 级 的 应 用 平台 ， 包 括 WAP 网 站 、APP 应 用 和 Web 网 站 。 这 三 种 平台 产生 的 数据 可 以 通过 网 站 分 析 系 统 直接 进行 整合 分 析 ， 以 便 评 估 不 同 平台 上 的 业务 效果 ; 同时， 网 站 分 析 系 
统 还 可 以 通过 整合 数据 集 进行 用 户 识 别 和 关联 ， 提 供 跨 平台 、 多 渠道 和 跨 终端 的 效果 分 析 ， 打 通 不 同 平台 间 的 运营 通路 。 比 如 ， 线 下 电视 媒体 的 标 版 广告 是 如 何 对 线 上 的 流量 产生 影响 的 、APP 上 的 移动 广 
告 对 Web 网 站 的 销售 影响 如 何 ， 以 及 用 户 是 如 何在 三 个 企业 级 的 应 用 平台 之 间 进 行 切换 等 。 


随 着 用 户 访问 碎片 化 特征 的 加 深 ， 跨 平台 、 多 渠道 和 跨 终端 的 访问 越 来 越 明 显 ， 尤 其 是 对 于 决策 周期 较 长 的 电 商 类 、 保 险 类 、 金 融 类 企业 而 言 ， 复 合 型 推广 、 整 合 性 传播 、 全 方位 维护 已 经 成 为 重要 的 
战略 方向 ， 而 针对 这 种 复杂 行为 的 数据 必须 通过 网 站 数据 分 析 中 独 有 的 工具 和 方法 进行 跟踪 、 整 合 与 分 析 。 


另外 ， 在 整合 网 站 数据 进行 分 析 的 过 程 中 ， 由 于 网 站 中 大 部 分 用 户 采 用 的 是 匿名 访问 的 方式 ， 因 此 传统 的 以 CRM 用 户 1D 等 为 主键 的 关联 方法 将 很 难 大 规模 的 被 适用 ， 这 种 方法 只 能 针对 已 经 登录 或 注册 
的 用 户 进行 行为 分 析 。 因 此 ， 占 绝对 数量 的 匿名 访问 以 及 基于 Cookie 的 唯一 访客 ID 的 网 站 数据 分 析 将 得 到 更 大 规模 的 应 用 。 这 种 数据 整合 分 析 可 以 为 企业 由 原来 从 已 知 用 户 行为 数据 中 提炼 关键 价值 点 演进 
到 依据 未 知 的 用 户 推导 结论 辅助 已 知 的 业务 进行 优化 。 


2. 多 业务 对 象 的 辅助 数据 支持 
(1) 营销 类 数据 支持 


营销 类 数据 支持 是 指 通 过 数据 提炼 相关 的 业务 观点 ， 为 营销 决策 、 营 销 实施 、 营 销 优化 和 评估 等 提供 数据 驱动 建议 的 过 程 。 营 销 类 数据 支持 的 对 象 主要 是 品牌 部 或 市 场 部 ， 其 下 属 细 分 业务 包括 : 媒介 
(品牌 ) 、SEM、CPS ( 按 销售 付费 ) 、SNS (新 媒体 ) 、EDM、PR、BD (商务 拓展 ) 等 。 


营销 类 数据 支持 是 最 常见 的 网 站 数据 分 析 需 求 ， 一 方面 由 于 所 有 的 营销 推广 渠道 效果 都 可 以 直接 或 间接 地 反馈 到 线 上 ( 纯 线 下 的 业务 经 营 除 外 ) ， 因 此 ， 效 果 更 容易 量化 评估 ; 另 一 方面 由 于 营销 费用 


是 公司 重要 的 费用 支出 项 目 ， 因 此 公司 更 加 关心 巨额 广告 费 投入 之 后 的 营销 产 出 。 因 此 ， 和 营销 类 分 析 是 网 站 数据 分 析 的 重要 课题 ， 也 是 结合 最 紧密 的 一 类 业务 需求 。 


营销 类 网 站 数据 分 析 需 求 通常 包括 : 前 期 整体 营销 策略 组 合 和 媒体 策划 、 中 期 渠道 推进 和 优化 执行 、 后 期 渠道 效果 评估 等 ， 网 站 数据 分 析 都 要 结合 特定 的 数据 分 析 和 挖掘 方法 针对 这 些 需求 提供 服务 。 
另外 ， 结 合适 当 的 追踪 方式 和 分 析 方 法 ， 网 站 数据 分 析 还 能 解决 传统 线 下 投放 浪费 的 “ 另 一 半 ” 广 告 费 的 效果 评估 问题 ， 使 每 次 的 广告 投放 有 的 放 矢 ,效果 评估 更 加 科学 、 全 面 。 


营销 类 数据 支持 常见 的 课题 包括 : 渠道 投放 效果 评估 、 跨 渠道 访问 特征 分 析 、 营 销 组 合 分 析 、 渠 道 最 佳 费 用 和 效果 产 出 点 分 析 、 渠 道 作 省 分 析 、 广 告 和 社会 化 媒体 的 销售 贡献 分 析 、 渠 道生 命 周 期 分 
析 、 渠 道 画像 和 价值 模型 分 析 等 。 


(2) 运营 类 数据 支持 


运营 类 数据 支持 指 的 是 狭义 的 运营 ， 即 以 网 站 为 载体 的 ， 包 括 网 站 运 维 支 持 、 内 容 优化 、 功 能 设计 和 业务 操作 为 核心 的 业务 体系 。 该 体系 包含 的 相关 部 门 主要 是 网 站 运 维 、 页 面 运营 、 功 能 优化 、 用 户 


体验 等 。 


运营 类 数据 需求 也 是 常见 的 网 站 数据 分 析 需 求 ， 由 于 是 围绕 网 站 开展 的 业务 动作 ， 因 此 业务 效果 更 容易 直接 反馈 和 作用 于 线 上 ， 形 成 从 前 期 策划 设计 、 中 期 落地 执行 、 后 期 优化 改进 到 再 评估 优化 业务 
流程 闭环 。 


运营 类 数据 支持 的 常见 课题 是 围绕 网 站 相关 的 数据 需求 ， 包 括 网 站 整体 设计 和 组 织 策略 、 网 站 诊断 及 整体 优化 、 网 站 资源 位 或 坑 位 最 佳 优化 组 合 、 促 销 活动 组 织 策略 、 页 面 产品 功能 喜好 、 整 体 用 户 体 
验 度 、 站 内 促销 流程 分 析 、 页 面 布局 和 最 佳 组 合 分 析 、 站 内 广告 位 挖 气 和 定价 分 析 等 。 


(3) 用 户 类 数据 支持 
用 户 类 数据 支持 是 指 以 用 户 为 核心 的 数据 支持 体系 ， 其 效果 直接 作用 于 会 员 或 客户 维系 的 相关 部 门 。 用 户 根据 登录 状态 分 为 匿名 用 户 和 实名 用 户 两 种 。 


网 站 分 析 的 整体 设计 逻辑 是 为 用 户 分 析 而 服务 的 ， 因 此 用 户 类 数据 支持 是 整个 网 站 数据 分 析 的 重要 组 成 部 分 。 网 站 用 户 分 析 是 用 户 整体 数据 分 析 的 重要 节点 ， 因 为 网 站 端 提供 了 传统 线 下 在 购买 或 转化 
之 前 的 所 有 属性 和 行为 记录 ， 为 对 用 户 进行 360° 认 知 提供 了 关键 的 “事前 ”视角 。 另 外 ， 由 于 实际 工作 中 可 能 有 超过 10% 甚 至 更 高 比例 的 用 户 是 匿名 状态 ， 该 状态 下 的 用 户 是 网 站 的 潜在 和 目标 客户 ,分析 
其 行为 对 整个 网 站 的 优化 改进 能 起 到 重要 的 参考 作用 。 


用 户 类 数据 分 析 点 通常 包括 用 户 基 本 属性 、 用 户 基 本 行为 和 转化 行为 的 分 析 与 挖掘 。 
. 用 户 基本 属性 : 人 口 社会 属性 、 地 理 位 置 属性 、 访 问 环境 、 终 端 属性 、 来 源 属性 等 。 
. 用 户 基本 行为 : 浏览 、 查 看 、 搜 索 、 点 击 、 事 件 。 

用 户 转 化 行为 : 试 有 用、 下载、 表单、 注册 、 人 登录、 订单 。 


用 户 类 数据 支持 常见 的 课题 包括 典型 用 户 特 征 提取 、 特 殊 类 别 用 户 行为 挖掘 (如 购买 了 A 类 产品 的 购物 路 径 、 高 活跃 度 用 户 站 内 行为 轨迹 ) 、 用 户 忠 诚 度 分 析 、 用 户 活跃 度 分 析 、 用 户 流失 和 预 流失 分 
析 、 用 户 广告 偏好 度 分 析 等 。 


(4) 销售 类 数据 支持 
销售 类 数据 支持 是 电子 商务 类 企业 的 核心 数据 应 用 之 一 ， 直 接 作 用 于 线 上 相关 采购 和 销售 类 部 门 ， 间 接 作 用 于 线 下 采购 、 人 仓储、 物流 配送 等 部 门 。 


网 站 数据 分 析 支 持 可 以 直接 为 线 上 相关 采 销 和 销售 类 部 门 提供 产品 销售 前 和 产品 销售 中 的 业务 洞察 ， 包 括 从 产品 被 检索 、 查 看 、 加 入 购物 车 ， 直 至 提交 订单 的 整个 动作 链条 结束 时 所 有 的 细节 数据 ， 能 
为 采 销 业务 趋势 的 把 握 和 症状 诊断 提供 最 直接 的 一 手 资 料 和 数据 支持 。 


同时 ， 线 上 的 产品 检索 、 查 看 、 加 入 购物 车 的 趋势 可 以 直接 映射 到 线 下 ， 如 根据 线 上 产品 需求 规划 、 采 购 方案 和 商品 组 合 ， 利 用 线 上 需求 预测 产品 库存 和 周转 策略 ; 根据 线 上 用 户 产 品 订货 特征 做 仓库 
最 佳 分 拣 路 线 制 定 和 调整 根据 各 品类 销售 预测 结果 提前 制定 物流 和 配送 方案 等 。 


销售 类 数据 支持 常见 的 课题 包括 : 销售 废 单 率 分 析 、 站 内 商品 销售 漏斗 分 析 、 产 品 关联 和 交叉 销售 分 析 、 商 品 最 佳 投放 渠道 分 析 、 商 品 站 内 资源 位 推荐 分 析 、 产 品 打包 销售 策略 分 析 、 产 品 需求 与 销售 
预测 供应 分 析 、 产 品 关注 周期 分 析 、 产 品 季节 性 分 析 、 恶 意 订单 分 析 、 价 格 敏 感度 分 析 等 。 


1.1.3 ”常见 的 几 种 “分 析 ” 概 念 


在 业务 实践 中 ， 有 很 多 “分 析 ” 概 念 会 让 大 家 感到 疑惑 ， 从 而 直接 影响 从 业者 的 职业 规划 ， 其 包括 职业 定位 、 发 展 路 线 等 。 因 此 有 必要 将 几 种 最 常见 的 “分 析 ” 概 念 进行 介绍 ， 为 大 
和 发 展 提供 帮助 。 


今后 的 职业 定位 


计 


1. 数 据 统 计 


数据 统计 是 对 最 初级 的 数据 从 业者 的 定位 ， 其 含义 如 其 字面 意思 一 统计， 具体 工作 是 从 海量 数据 中 进行 数据 提取 、 数 据 清洗 、 数 据 汇 总 和 基本 输出 工作 。 数 据 统计 是 所 有 公司 必 不 可 少 的 工作 内 容 ， 
由 于 该 工作 不 需要 具有 太 高 的 技术 含量 ， 因 此 其 替代 性 非常 强 ， 通 常 该 工作 会 通过 数据 产品 自动 化 来 实现 。 


数据 统计 要 求 从 业者 具有 良好 的 数据 提取 和 处 理 能 力 ， 核 心 需求 能 力 是 能 熟练 掌握 SQL 的 使 用 技能 及 Excel 的 使 用 技能 ， 这 是 从 业者 职业 发 展 的 开始 。 
统计 类 工作 的 定位 一 般 是 初级 分 析 师 或 数据 分 析 员 。 我 们 常见 的 统计 工作 如 日 报 、 周 报 、 月 报 、 季 报 、 年 报 等 ， 直 接 陈列 数据 、 报 表 等 类 型 的 报告 皆 属 于 此 类 工作 的 典型 内 容 。 
2. 数 据 分 析 


数据 分 析 是 在 数据 统计 基础 上 的 必要 延伸 ， 也 是 数据 从 业者 的 必 经 阶段 。 数 据 分 析 的 基本 流程 通常 包括 需求 收集 、 需 求 处理 、 需 求 评估 、 数 所 准备、 数据 分 析 、 数 据 展现 ， 除 了 基本 流程 外 ， 通 常 还 会 
包括 业务 沟通 、 业 务 优化 等 过 程 。 数 据 分 析 的 需求 常见 于 大 中 型 公司 ， 小 型 公司 的 分 析 类 需求 较 少 ， 更 多 的 是 侧重 于 统计 需求 。 


数据 分 析 对 从 业者 的 要 求 较 数据 统计 高 ， 需 要 从 业者 具备 良好 的 数据 处 理 和 分 析 能 力 ， 同 时 由 于 数据 要 符合 落地 性 的 需求 ， 要 求 从 业者 需要 具备 基本 的 业务 常识 和 经 验 ， 以 保证 数据 分 析 的 结果 有 用 、 
可 用 、 易 用 ， 进 而 推动 业务 人 员 理 解数 据 、 分 析 业 务 、 优 化 业务 。 


分 析 类 工作 根据 从 业者 的 层次 不 同 ， 通 常会 分 为 中 级 分 析 师 、 高 级 分 析 师 、 首 席 分 析 师 等 ， 不 同 公司 对 分 析 师 的 级 别 定 义 不 同 ， 但 作为 中 高 级 分 析 师 ， 其 关注 点 不 仅 是 数据 本 身 ， 而 是 更 侧重 于 从 数据 
中 挖掘 价值 、 发 现 业 务 ， 进 而 优化 其 可 优化 的 节点 。 常 见 的 分 析 类 工作 包括 专项 类 分 析 、 市 场 类 分 析 、 项 目 类 分 析 等 。 


3. 数 据 挖掘 


数据 挖掘 严格 意义 上 属于 数据 分 析 的 一 部 分 ， 但 由 于 其 独特 的 技术 技能 要 求 及 应 用 领域 ， 已 经 从 数据 分 析 中 脱离 出 来 形成 单独 的 数据 职业 。 数 据 挖掘 是 指 从 海量 的 数据 中 挖掘 其 隐 含 的 、 洪 在 的 数据 价 
值 的 过 程 ， 侧 重点 是 针对 未 知 知识 的 探索 。 


数据 挖掘 要 求 从 业者 在 人 工 智 能 、 机 器 学 习 等 挖掘 技术 中 至 少 掌握 一 门 数据 挖掘 技术 ， 并 且 需 要 特定 程序 和 语言 进行 输出 ， 展 示 层 面 需要 具有 一 定 的 可 视 化 技术 来 解释 挖掘 结果 和 价值 ， 因 此 具有 较 高 
的 数据 从 业 要 求 。 


数据 挖掘 从 业者 的 公司 定位 ， 根 据 面 向 对 象 的 不 同 可 分 为 以 下 两 种 。 

. 业务 类 数据 挖掘 工程 师 : 其 侧重 点 是 运用 数据 挖 气 算 法 为 业务 提供 数据 分 析 和 挖掘 价值 点 ， 直 接 优 化 业务 运作 。 

. 技术 类 数据 挖掘 工程 师 : 其 侧重 点 是 通过 数据 挖掘 算法 的 优化 和 改进 ， 为 数据 产品 如 DSP、RTB、 个 性 化 推荐 等 提供 算法 支持 ， 是 整个 数据 产品 的 重要 环节 。 
4. 网 站 分 析 


网 站 分 析 是 数据 分 析 的 一 个 分 支 ， 其 在 数据 分 析 的 基础 上 拓展 了 数据 的 上 下 游 工 作 ， 上 游 包 括 数 据 采 集 、 数 据 存储 、 数 据 处 理 ， 下 游 包 括 数 据 展 示 、 数 据 优化 。 因 此 网 站 分 析 相 对 于 其 他 “分 析 ” 类 概 
念 具备 相对 完整 的 数据 生态 环境 ， 即 网 站 分 析 涵 盖 了 整个 数据 从 采集 、 人 存储 、 处 理 、 分 析 、 展 现 和 应 用 优化 的 全 过 程 。 


网 站 分 析 要 求 从 业者 了 解 互 联网 运行 的 基本 机 制 ， 掌 握 网 页 设计 的 相关 技术 ， 作 为 网 站 分 析 的 工具 载体 一 网 站 分 析 系 统 ， 也 需要 熟练 掌握 和 应 用 ， 网 站 分 析 的 基本 方法 、 概 念 和 定义 也 需要 熟 答 于 
心 ， 当 然 ， 最 重要 的 还 是 要 具备 商业 意识 ， 要 把 数据 的 价值 应 用 到 业务 中 实现 其 价值 。 


网 站 分 析 作为 一 个 特殊 的 职业 ， 通 常 定位 于 与 流量 相关 的 业务 体系 中 ， 如 草 销 中 心 、 品 牌 中 心 、 推 广 中 心 等 ， 公 司 人 员 定 位 包括 初级 网 站 分 析 师 、 中 级 网 站 分 析 师 和 高 级 网 站 分 析 师 。 网 站 分 析 工 作 的 
核心 是 围绕 网 站 数据 的 产生 、 优 化 和 落地 ， 因 此 更 多 侧重 于 营销 、 网 站 运营 、 用 户 体验 和 在 线 销售 的 数据 支持 。 


1.2 ”网 站 数据 分 析 的 5 个 误区 


网 站 数据 分 析 能 实现 对 所 有 在 线 活 动 的 数据 洞察 ， 通 过 数据 我 们 可 以 总 结 规律 、 挖 掘 价值 、 剖 析 原 因 ， 甚 至 可 以 优化 企业 的 战略 和 战术 并 确定 其 发 展 方向 ， 使 其 直接 服务 于 决策 者 和 执行 者 ， 因 此 它 是 
企业 日 常 运营 和 发 展 的 必要 组 成 部 分 。 但 仔细 审视 数据 本 身 ， 我 们 会 发 现 隐 匿 于 美好 之 下 的 残缺 ， 这 些 残缺 是 由 于 信息 的 不 对 称 、 价 值 观 的 指向 、 个 人 能 力 的 不 足 ， 甚 至 是 公司 的 流程 和 体制 等 原因 而 产生 
的 。 误 用 数据 不 但 对 公司 业务 发 展 没有 正 向 帮助 ， 反 而 会 为 业务 团队 带 来 决策 风险 。 


1. 网 站 数据 的 价值 真 的 有 那么 大 吗 


作为 网 站 数据 分 析 的 从 业者 ， 是 否 问 过 自己 这 样 一 个 问题 : 网 站 数据 分 析 可 以 为 公司 网 站 端 运营 活动 提供 决策 支持 ， 但 价值 真 的 有 那么 大 吗 ? 假如 公司 没有 网 站 数据 分 析 ， 各 项 业务 运作 体系 是 否 会 受 
到 影响 ? 如 果 你 的 回答 是 不 确定 甚至 是 确定 没有 影响 ， 那 足以 证 明 你 在 整个 公司 流程 中 所 从 事 的 网 站 数据 分 析 工 作 没 有 多 少 价值 。 对 于 不 同类 型 的 公司 ， 网 站 数据 分 析 工 作 的 价值 大 小 有 所 差异 。 


在 线 营 销 类 或 服务 类 广告 公司 的 业务 核心 是 通过 为 广告 主 提供 广告 投放 、 评 估 和 优化 业务 ， 从 而 获得 费用 差价 、 佣 金 返点 、 服 务 费 等 ， 由 此 形成 公司 的 核心 利润 业务 。 网 站 数据 分 析 所 处 的 角色 是 对 这 
些 业 务 体系 提供 数据 评估 和 优化 ， 此 时 由 于 从 业者 的 工作 与 公司 核心 业务 结合 紧密 ， 因 此 其 职业 价值 会 比较 高 。 


线 下 苏宁 、 国 美的 大 卖场 能 为 其 各 自 集团 的 销售 类 业务 贡献 90% 以 上 的 利润 ， 而 线 上 的 电 商 业务 体系 分 割 了 不 到 10% 甚 至 需要 利润 补贴 进行 运作 ， 此 时 针对 线 上 业务 的 网 站 分 析 体 系 的 价值 在 整个 苏宁 
和 国美 集团 中 显得 微不足道 。 此 时 由 于 从 业者 的 工作 与 公司 核心 业务 所 创造 的 价值 相差 较 大 ， 因 此 其 职业 价值 会 比较 低 。 


上 述 两 大 卖场 的 例子 前 述 了 网 站 数据 分 析 在 不 同 公司 的 不 同 存在 意义 ， 从 本 质 上 讲 网 站 数据 分 析 价 值 的 外 部 环境 取决 于 公司 的 运营 架构 ， 即 公司 的 核心 业务 模式 是 否 与 网 站 分 析 相 关 以 及 相关 性 的 强 
弱 。 


全 尘 总 在 所 有 公司 的 运营 体系 中 ， 网 站 数据 分 析 只 能 满足 业务 类 的 数据 分 析 需 求 〈 如 营销 分 析 ) ， 职 能 类 的 分 析 需 求 〈 如 财务 分 析 ) 是 无 法 通过 网 站 数据 分 析 解 决 的 。 因 此 ， 网 站 数据 分 析 需 要 与 公 
司 整体 数据 整合 ， 形 成 企业 大 数据 支持 下 的 商业 智能 ， 从 全 局 性 的 角度 建立 数据 运营 支持 体系 。 


2. 网 站 数据 的 质量 真 的 那么 好 吗 

数据 的 质量 是 所 有 数据 工作 中 最 基础 但 也 是 最 容易 被 忽视 的 一 个 环节 ， 如 果 你 对 数据 的 质量 没有 概念 ， 看 下 面 列举 的 几 种 简单 的 数据 情况 : 
. 三 个 数据 系统 中 同样 定义 的 “销售 额 ” 指 标 数据 不 一 致 。 

-数据库 中 的 “邮箱 ”字段 80% 为 空 。 


. 数据 库 的 “性 别 ” 字 段 中 某 些 值 为 10。 


. 数据 库 中 “产品 名 称 ” 字 段 出 现 乱码 。 


以 上 问题 的 出 现 就 是 数据 质量 差 造成 的 ， 出 现 这 些 情 况 既 有 公司 内 部 原因 又 有 外 部 原因 。 内 部 原因 包括 数据 采集 方式 错误 、 数 据 验证 机 制 不 全 面 、 数 据 同步 不 及 时 、ETL 过 程 错误 、 数 据 提 取 错 误 等 ; 外 
部 原因 包括 用 户 填写 的 信息 不 规范 、 用 户 数据 采集 环境 存在 客观 差异 等 。 


在 网 站 数据 分 析 师 或 数据 分 析 师 接触 到 所 要 分 析 的 数据 之 前 ， 这 些 数据 会 经 过 数据 采集 (包含 异 常 值 处 理 和 采集 入 库 ) 、 数 据 人 存储 ( 主 从 备份 和 不 同 库 表 间 数据 同步 ) 、 数 据 提取 (ETL、SQL 取 数 ) 
个 阶段 ， 如 果 事 先 不 对 数据 进行 质量 校 验 ， 会 因为 基本 数据 问题 导致 后 期 数据 分 析 和 挖掘 无 法 进行 ， 甚 至 会 在 分 析 数 据 后 才 发 现 整个 结果 都 是 错 的 一 一 用 错误 的 数据 进行 分 析 必 然 会 导致 错误 的 结论 。 


在 大 多 数 情 况 下 ， 数 据 质量 由 于 其 隐秘 性 以 及 难以 产生 业务 和 技术 应 用 价值 而 不 被 公司 重视 ， 但 作为 数据 分 析 师 需要 具有 数据 质量 意识 ， 拒 绝 “Rubbish in rubbish out”! 
人 @@ 注 意 ”数据 质量 校 验 是 所 有 数据 预 处 理 的 第 一 步 ， 因 此 数据 分 析 师 一 定 要 养 成 习惯 ， 在 做 数据 分 析 之 前 应 进行 数据 质量 验证 ， 下 文 会 讲 到 如 何 进行 数据 验证 。 
3 数据 需求 不 总 是 与 业务 需求 相 吻 合 


要 进行 分 析 挖 掘 的 数据 必须 具备 一 定 的 前 提 条 件 ， 即 符合 数据 规律 且 符 合 业务 需求 的 数据 才能 用 来 为 业务 服务 ， 但 在 很 多 情况 下 数据 自身 的 这 种 严谨 性 要 求 会 与 业务 分 析 需 求 产生 冲突 。 业 务 方 通常 需 
要 快速 、 及 时 、 正 确 、 全 面 地 给 出 结论 、 做 出 反馈 意见 ， 进 而 落地 执行 优化 ， 但 这 种 需求 与 数据 的 严谨 性 通常 是 ;冲突 的 ， 这 种 冲突 的 本 质 是 数据 需求 的 严谨 性 要 求 数据 是 稳定 的 、 全 面 的 、 长 期 的 、 及 时 
的 ， 因 此 通常 需要 有 一 定 的 周期 和 时 间 才 能 产生 数据 价值 。 


数据 需求 的 严谨 性 主要 体现 在 数据 采集 阶段 。 在 数据 采集 阶段 要 求 数据 样本 量 必须 具备 在 一 定 周 期 内 相对 稳定 的 特征 ， 并 且 这 种 特征 能 在 后 期 的 数据 处 理 中 排除 异常 值 波 动 的 影响 ， 进 而 得 到 完整 、 真 
实 反馈 业务 效果 的 数据 。 


数据 采集 通常 会 受 两 方面 因素 的 影响 ， 一 是 数据 采集 单位 效率 ， 即 每 天 能 采集 多 少数 据 ; 二 是 周期 ， 即 使 数据 单位 采集 的 效率 很 高 ， 也 不 能 只 使 用 一 天 的 数据 进行 分 析 ， 因 为 当天 的 数据 可 能 存在 异常 
值 ， 而 且 该 异 弟 值 不 通过 数据 对 比分 析 是 无 法 进行 验证 和 剔除 的 。 因 此 ， 数 据 采集 阶段 通 囊 人 至少 需要 采集 一 周 的 数据 ， 如 果 采 集 效 率 低 ， 则 需求 时 间 会 更 长 。 


但 在 业务 方 看 来 ， 如 此 “长 ”的 时 间 通 常 是 无 法 忍受 的 。 业 务 方 通 常 想 要 在 较 大 业务 完成 后 立即 反馈 结果 进行 优化 矫正 ， 但 我 们 看 到 业务 方 的 这 种 “ 短 、 快 、 全 ”的 需求 直接 与 数据 需求 的 严谨 性 产生 


冲突 。 这 种 冲突 的 场景 包括 : 
某 站 内 广告 在 首页 焦点 图 的 A 位 置 只 放 3 天 ，3 天 后 马上 下 架 换 新 素材 。 
某 站 内 UED 部 门 做 产品 体验 提升 ， 每 周 进 行 一 次 产品 方案 优化 。 
以 上 两 种 业务 场景 从 客观 上 直接 导致 数据 需求 严谨 性 的 缺失 ， 因 此 会 对 数据 质量 和 后 期 的 分 析 挖 掘 产 生 一 定 的 影响 。 


人 @ 湾 数据 需求 的 严谨 性 并 不 意味 着 数据 结果 的 产生 一 定 需 要 很 长 的 时 间 ， 时 间 长 短 取决 于 业务 需求 中 数据 需求 对 时 间 和 数据 样本 的 要 求 。 通 常 实时 数据 、 即 席 报表 都 能 以 很 快 的 速度 反馈 业务 关键 
节点 的 效果 ， 以 帮助 业务 做 及 时 调整 ， 比 如 茶 渠 道 推广 效果 、 站 内 菜 活 动 实时 效果 等 。 但 菜 些 长 期 、 对 全 局 性 有 影响 的 关键 业务 节点 需要 更 慎重 的 决策 支持 以 避免 数据 决策 失误 ， 比 如 首页 改版 、 购 物 车 改 

4. 数 据 能 帮 你 分 析 问 题 吗 

通常 数据 在 相关 系统 和 工具 的 预 设 工作 机 制 下 ， 会 自动 呈现 出 我 们 想 要 看 到 的 关键 KPI， 甚至 在 我 们 把 一 些 数据 分 析 和 挖掘 算法 模式 化 后 ， 数 据 可 直接 通过 自动 化 的 流程 产 出 我 们 想 要 的 价值 结果 。 


实际 上 ， 数 据 作 为 一 种 客观 实体 ， 其 本 身 并 没有 价值 ， 它 并 不 能 帮助 我 们 分 析 问 题 ， 而 只 是 提供 了 数据 分 析 的 “素材 ”。 唯 一 能 让 数据 发 挥 作 用 的 是 人 ， 包 括 数据 分 析 师 、 挖 掘 工程 师 等 数据 从 业者 ， 
因此 大 多 数 企业 的 现状 不 是 缺少 数据 ， 而 是 缺少 能 将 数据 价值 活用 出 来 为 企业 提供 辅助 决策 甚至 是 数据 驱动 能 力 的 “人 才 ”。 


不 过 ， 即 使 有 了 “人才 ” ， 数 据 就 能 发 挥 作 用 、 帮 助 我 们 解决 所 有 的 问题 吗 ” 在 数据 从 业者 的 工作 环境 中 ， 永 远 都 会 涉及 两 种 人 : 数据 从 业者 和 业务 人 员 。 即 使 数据 从 业者 的 能 力 再 强 ， 仍 然 无 法 完整 
重 现 业 务 场景 ， 但 这 种 场景 恰恰 是 业务 人 员 自 身 的 经 历 ， 他 们 的 这 种 经 历 是 数据 分 析 和 挖掘 的 宝贵 财富 ， 甚 全 很 多 数据 结果 只 需要 凭借 他 们 的 经 验 就 可 以 解释 清楚 ， 举 例如 下 。 


某 公司 要 进行 妥 投 率 的 分 析 ， 调 用 了 所 有 的 从 订单 、 分 拒 、 出 库 、 配 送 到 收 货 的 数据 ， 发 现 某 个 配送 节点 的 受 投 率 较 低 。 数 据 分 析 师 使 用 各 种 算法 和 模型 进行 分 析 都 百 思 不 得 其 解 ， 而 其 配送 站 点 的 物 
流 经 理 的 一 句 话 让 整个 数据 分 析 的 难点 迎刃而解 一 一 该 配送 站 的 某 快递 员 请 假 导 致 货物 没有 及 时 发 出 。 


@ia 示 数据 从 业 人 员 一 定 要 多 与 业务 人 员 沟 通 ， 从 需求 发 起 到 报告 落地 验证 和 再 优化 的 整个 过 程 ， 业 务 人 员 都 是 必 不 可 少 的 环节 ， 他 们 的 很 多 业务 经 验 和 常识 往往 能 为 数据 从 业者 指明 方向 并 降低 数 


据 项 目的 失败 概率 。 
5. 数 据 真 的 是 公正 客观 的 吗 
数据 有 没有 立场 吗 ? 


数据 的 公正 客观 在 大 多 数 人 看 来 是 与 生 俱 来 的 ， 因 为 数据 的 存在 就 是 客观 的 。 数 据 的 存在 的 确 是 客观 的 ， 但 数据 的 应 用 主体 是 “人 ”， 不 同人 对 同一 数据 的 分 析 结 果 会 有 所 不 同 ， 这 取决 于 数据 从 业者 


我 们 对 数据 存在 的 初始 期 望 是 希望 数据 能 客观 的 反馈 业务 结果 ， 并 服务 于 业务 ， 从 而 对 其 进行 优化 和 改进 。 如 果 对 数据 的 分 析 和 解读 不 客观 、 不 公正 ， 那 么 结果 必然 有 失 公 人 允 ， 基 于 数据 的 决策 将 会 面 


临风 险 。 
为 什么 会 这 样 呢 ? 
数据 从 业者 的 立场 决定 了 数据 的 立场 ， 这 种 立场 受 以 下 两 方面 因素 的 影响 : 


一 是 数据 从 业者 在 公司 所 处 的 角色 。 如 果 数 据 从 业者 在 企业 组 织 架构 中 位 于 采 销 中 心 ， 在 对 公司 级 数据 进行 整理 并 汇报 采 销 相关 数据 时 ， 出 于 对 采 销 中 心 或 其 他 因素 的 保护 意识 ， 可 能 会 出 现 不 客观 的 
结果 ， 比 如 只 报喜 不 报 忱 ， 甚 至 会 颠倒 是 非 。 


二 是 数据 从 业者 基本 的 价值 观 。 任 何人 都 有 基本 的 认 知 价值 观 ， 对 于 数据 从 业者 而 言 ， 如 果 在 拿 到 一 个 案例 之 后 ， 先 有 了 结果 偏向 ， 那 么 整个 分 析 和 挖掘 过 程 必然 会 只 选择 与 其 结果 一 致 性 的 样本 和 方 
法 进行 验证 ， 这 可 能 会 直接 导致 对 客观 数据 分 析 结果 的 扭曲 。 


全 尘 意 客观 、 公 正 是 数据 从 业者 的 职业 要 求 和 个 人 素质 之 一 ， 任 何 基 于 数据 的 决策 项 目 都 要 求 从 业者 乘 着 客观 、 公 正 的 态度 去 对 待 。 


1.3 ”识别 网 站 数据 具有 欺骗 性 的 3 种 形态 


辨别 数据 欺骗 性 是 避免 数据 决策 失误 的 重要 环节 。 在 很 多 情况 下 我 们 看 到 的 都 是 经 过 加 工 的 数据 ， 数 据 一 定 是 “眼见 为 实 ” 吗 ? 数据 是 如 何 “ 说 谎 ” 的 呢 ? 

1 数据 展示 的 欺骗 性 

数据 可 视 化 通常 可 以 帮助 读者 更 好 地 理解 数据 ， 常 见 的 载体 是 图 表 或 图 形 。 数 据 展示 的 欺骗 性 是 指 利 用 数据 可 视 化 的 方法 ， 对 特定 图 表 或 图 形 的 展示 进行 特殊 处 理 ， 从 而 使 数据 解读 者 产生 视觉 上 的 错 
误 认识 。 

(1) 图 表 拉 伸 


图 表 拉 伸 是 指 图 表 的 高 和 宽 不 符合 正常 比例 ， 通 过 刻意 拉 伸 高 或 宽 等 途径 人 为 形成 某 种 假象 。 在 正常 情况 下 ， 图 表 宽 ( 横 轴 ) 与 高 ( 纵 轴 ) 的 比例 为 1: 1 到 1: 2 之 间 ， 如 果 在 这 个 范围 之 外 ， 数 据 显示 
结果 会 过 于 异常 。 如 图 1-1 所 示 ， 在 正常 情况 下 订单 量 走 势 平缓 ， 但 缩短 横 轴 之 后 的 订单 量 走势 显得 更 加 陡峭 ， 会 让 人 误 认 为 效果 非常 显著 。 


订单 量 走势 图 sa 订单 量 走势 图 
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图 1-1 同样 数据 在 不 同 拉 伸 程度 下 的 对 比 
(2) 坐标 轴 的 特殊 处 理 


坐标 轴 的 特殊 处 理 是 指数 据 排 列 非 正常 展示 ， 包 括 数据 单位 设置 、 取 对 数 ， 甚 至 是 逆序 排序 等 ， 这 些 操作 直接 影响 了 数据 的 正常 展示 ， 甚 至 会 带 来 相反 的 错觉 。 如 图 1-2 所 示 ， 在 正常 情况 下 不 同 省 份 的 
数据 差异 非常 大 ， 但 在 取 对 数 处 理 之 后 由 于 数据 都 落 在 相对 较 小 的 区 间 内 ， 导 致 各 省 份 差异 非常 小 ， 这 就 是 同样 的 数据 ， 不 同 的 结论 。 


(3) 数据 标准 化 


数据 标准 化 的 本 质 是 对 绝对 值 较 大 的 数据 进行 处 理 ， 使 其 在 保持 自身 数据 相对 性 的 前 提 下 ， 将 不 同 的 数据 落 到 相同 的 数据 区 间 ， 以 便 更 好 地 进行 不 同 数据 间 趋 势 、 相 关 性 等 结果 分 析 。 常 用 的 数据 标准 
化 方法 包括 2 标准 化 和 0-1 标 准 化 。 如 果 数 据 从 业者 不 提前 告知 ， 可 能 会 让 业务 人 员 误 以 为 两 种 数据 的 结果 值 异常 ， 不 符合 实际 业务 场景 。 


各 省 份 订单 量 对 比 ”各 省 份 订 单 量 对 比 


北京 ”上海 广州 ”深圳 ”山东 ”海南 上 海 广州 ”深圳 ”山东 ”海南 


图 1-2 ”数据 经 坐标 轴 处 理 后 的 展示 对 比 


对 于 如 表 1-1 所 示 的 数据 ， 如 果 直 接 在 此 基础 上 进行 展示 订单 量 和 跳出 率 关 系 ， 则 很 难 发 现 数据 价值 。 为 了 更 好 地 说 明 问 题 ， 通 常 我 们 会 把 两 个 数据 经 数据 标准 化 后 放 到 一 个 数据 区 间 内 ， 在 表 1-1 中 使 
用 0-1 标 准 化 来 对 订单 量 和 跳出 率 进 行 处 理 。 


表 1-1 某 周 期 内 订单 量 和 跳出 率 的 数据 


处 理 之 后 的 数据 会 更 具备 展示 和 解读 性 ， 如 图 1-3 所 示 。 


] 单 量 与 跳出 率 关 系 图 
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图 1-3 ”订单 量 与 跳出 率 关系 图 


@ia 示 数据 标准 化 是 分 析 不 同 量 级 数据 间 关 系 的 常用 方法 ， 掌 握 标 准 化 不 仅 有 利于 数据 从 业者 进行 数据 分 析 ， 更 容易 让 业务 人 员 从 感性 的 角度 直接 发 现 两 种 数据 间 的 相互 关系 ， 对 理解 数据 有 很 大 的 
帮助 。 


对 于 该 类 数据 展现 的 欺骗 性 ， 需 要 数据 从 业者 在 进行 数据 分 享 和 沟通 时 先 介绍 图 形 展示 时 进行 的 数据 处 理 步 又、 方法 和 目的 ， 以 避免 业务 人 员 误解 数据 。 同 时 ， 作 为 业务 人 员 需 要 掌握 以 下 基本 的 数据 
理解 常识 和 图 表 理 解 步 又 。 


步骤 1 看 标题 ， 了 解 图 表 要 表达 的 基本 合 义 。 


中 


步骤 2 ”看 坐标 轴 ， 包 括 横 轴 和 纵 轴 ， 看 图 表 是 否 存 在 使 用 双 坐 标 轴 、 纵 轴 特 殊 处 理 和 排序 等 问题 。 

步骤 3 ”看 示例 ， 如 果 图 表 中 有 多 个 数据 ， 需 要 了 解 每 个 数据 的 含义 。 

步骤 4 看 注释 ， 通 常 分 析 师 会 将 图 表 的 样本 、 时 间 、 处 理 方法 等 一 并 写 到 注释 中 。 

2. 数 据 处 理 的 欺骗 性 

数据 处 理 过 程 中 的 欺骗 性 是 较 难 被 察觉 的 一 类 欺骗 方法 ， 由 于 数据 在 进行 结论 展现 前 会 经 过 取样 、 清 洗 、 模 型 和 分 析 方 法 选择 以 及 应 用 等 过 程 ， 每 个 过 程 都 有 可 能 存在 问题 。 
(1) 数据 样本 问题 


在 进行 数据 分 析 之 前 可 能 存在 需要 抽样 的 问题 ， 并 且 在 数据 量 越 大 的 情况 下 出 现 抽 样 的 概率 越 大 。 合 理 的 抽样 有 助 于 提高 数据 分 析 和 挖掘 的 效率 ， 能 在 保证 数据 质量 的 前 提 下 减少 人 力 和 时 间 成 本 ， 因 
此 抽样 是 大 数据 分 析 和 挖掘 的 必要 步骤 。 


数据 抽样 的 方法 因 人 而 异 ， 只 要 能 代表 全 部 样本 特征 的 抽样 方法 都 可 用 ， 因 此 不 存在 最 好 的 抽样 方法 ， 只 有 最 适合 的 抽样 方法 。 如 果 抽 样 过 程 中 出 现 问题 ， 会 直接 影响 后 期 所 有 的 数据 工作 ， 有 恶意 的 抽 
样 方法 甚至 会 直接 导致 数据 结论 的 错误 。 常 见 的 数据 抽样 问题 是 抽样 主体 不 同和 抽样 样本 量 不 同 。 


抽样 主体 不 同 。 相 同 的 样本 ， 在 所 有 条 件 都 相同 的 情况 下 ， 哪 怕 只 有 一 个 抽取 逻辑 不 同 ， 就 可 能 导致 后 期 的 结果 更 符合 或 不 符合 “预期 ”。 比 如 要 执行 用 户 挽回 业务 的 动作 ， 需 要 提炼 出 更 具备 挽回 可 
能 性 的 用 户 ， 假 如 抽样 样本 分 别 是 最 近 6 个 月 未 访问 和 最 近 6 个 月 未 购物 但 有 访问 行为 的 用 户 ， 几 乎 可 以 不 用 做 业务 测试 和 效果 分 析 ， 最 终 的 结果 必然 是 最 近 6 个 月 有 过 访问 行为 的 用 户 具 备 更 高 的 挽回 概 


z 
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抽样 样本 量 不 同 。 严 格 来 说 样本 量 不 同 并 不 一 定 是 故意 欺骗 ， 因 为 受 客观 环境 的 影响 确实 人 存在 具备 某 些 特征 的 用 户 样本 很 少 ， 比 如 有 年 龄 信息 的 用 户 在 互联 网 公司 的 CRM 系 统 中 的 比例 占 比 很 低 ， 这 是 
无 法 改变 的 。 但 即使 是 这 样 的 客观 情况 ， 基 于 较 大 差异 的 样本 量 分 析 和 挖掘 的 数据 结果 也 很 可 能 具备 一 定 的 偶然 性 ， 可 信 度 较 低 。 


ta 当 某 种 数据 因为 客观 环境 导致 样本 量 较 少时 ， 可 以 采用 数据 欠 抽 样 和 过 抽样 的 方法 进行 平衡 。 
(2) 数据 处 理 问 题 


数据 处 理 指 的 是 在 开始 分 析 数 据 之 前 的 清洗 工作 ， 通 常 需 要 对 样本 进行 整体 数据 观察 ， 以 确认 样本 数量 、 均 值 、 极 值 、 方 差 、 标 准 差 及 数据 范围 等 。 数 据 在 应 对 异常 情况 的 处 理 时 也 会 存在 故意 “说 
谎 ” 的 问题 ， 最 常见 的 异常 情况 包括 极 大 值 和 极 小 值 、 缺 失 值 、 错 误 值 等 。 每 种 异常 值 的 处 理 方法 都 不 同 会 对 数据 处 理 结果 产生 直接 影响 ， 并 且 异 常 值 的 样本 数量 越 多 ， 对 数据 处 理 结果 的 影响 就 越 大 。 


举例 : 某 公 司 一 天 的 销售 数据 显示 ， 当 天 的 销售 额 异常 高 。 在 对 数据 进行 整体 观察 后 发 现 当 天 存在 异常 离 群 值 一 一 极 大 值 ， 该 值 直接 将 当天 的 整体 数据 拉 升 到 一 个 不 可 信 的 高 度 。 该 异常 值 可 能 是 恶意 
下 单 、 行 单 、 测 试 订单 ， 甚 至 是 系统 问题 引起 的 ， 无 论 是 哪 种 原因 ， 都 直接 导致 了 销售 额 异常 。 如 果 忽 视 该 异常 值 的 处 理 ， 直 接 对 包含 异常 值 的 数据 样本 进行 分 析 与 挖掘 ， 结 论 就 是 利好 的 ， 但 并 不 符合 实 


际 。 

(3) 数据 分 析 问 题 

在 数据 分 析 和 挖掘 的 过 程 中 ， 同 一 种 目标 下 都 存在 多 种 可 供 选择 的 分 析 方 法 与 挖掘 模型 。 不 同 的 方法 和 模型 产生 的 结果 未 必 相 同 ， 尤 其 是 具有 定性 分 析 的 对 比 类 分 析 ， 所 对 照 的 样本 不 同 ， 结 果 就 不 一 
样 。 

举例 : 某 公 司 一 天 的 销售 额 是 1000 万 元 ， 该 销售 额 是 多 是 少 ? 对 比 昨日 、 上 周 同 期 、 上 月 同期 、 去 年 同期 ， 甚 至 是 随便 选择 一 天 的 销售 数据 ， 结 果 可 能 都 会 存在 很 大 的 差异 。 这 就 意味 着 不 同 的 对 比 对 
象 决定 了 数据 解读 的 方向 。 

对 于 该 类 数据 取样 、 处 理 和 分 析 的 欺骗 识别 ， 在 业务 人 员 与 数据 分 析 师 沟通 的 过 程 中 ， 双 方 都 要 把 基本 的 数据 选取 规则 、 处 理 方 法 沟通 清楚 ， 对 其 中 明显 的 错误 或 失误 进行 及 时 纠正 。 

3. 数 据 意识 欺骗 


数据 意识 欺骗 是 隐藏 等 级 最 高 、 最 严重 的 欺骗 和 错误 ， 通 常 在 数据 从 业者 进行 数据 分 析 和 挖掘 之 前 就 已 经 有 了 结论 ， 在 数据 抽取 、 分 析 处 理 、 后 期 展现 等 环节 中 只 选取 有 利于 证 明 其 论断 的 方法 和 材 


料 ， 因 此 会 产生 严重 的 误导 行为 ， 如 果 是 辅助 高 层 作出 决策 ， 甚 至 会 带 来 严重 的 决策 失误 ! 因此 ， 数 据 从 业者 一 定 要 保持 中 立 的 立场 、 客 观 的 态度 。 
在 与 数据 从 业者 沟通 的 过 程 中 ， 如 果 发 现 确实 存在 某 种 固定 的 倾向 性 ， 就 需要 引起 注意 。 另 外 ， 对 于 以 下 相关 情形 ， 也 需要 引起 警惕 : 
在 数据 报告 中 刻意 隐藏 数据 提取 细节 。 从 来 不 注 明 数据 出 处 、 数 据 取样 时 间 、 数 据 取样 规则 、 数 据 处 理 和 分 析 挖 气 方 法 等 ， 这 通常 意味 着 该 报告 刻意 隐藏 数据 提取 细节 ， 需 要 引起 重视 。 
数据 报告 样本 过 少 的 问题 。 比 如 样本 共 1000 个 ， 其 中 北京 提供 的 可 能 只 有 100 个 ， 其 余 900 个 是 其 他 省 份 提供 的 ， 基 于 100 个 样本 分 析出 与 北京 相关 的 数据 结论 显然 可 信 度 较 低 。 


数据 报告 存在 明显 的 倾向 性 。 任 何事 物 都 有 正 反 两 方面 ， 对 事物 进行 分 析 ， 如 果 只 分 析 其 优势 或 劣势 ， 结 果 必 然 不 全 面 、 不 客观 。 


1.4 辅助 决策 与 数据 驱动 的 争议 
辅助 决策 和 数据 驱动 是 数据 发 挥 作用 的 两 种 形式 ， 但 大 家 对 于 两 者 的 区 别 不 甚 了 解 ， 甚 全 有 很 多 人 误 以 为 自己 做 的 统计 类 工作 就 是 数据 驱动 。 
1.4.1 辅助 决策 
1. 含 义 
辅助 决策 即 决策 支持 ， 它 是 以 决策 主题 为 中 心 ， 借 助 计算 机 相关 技术 辅助 决策 者 通过 数据 、 模 型 、 知 识 等 进行 业务 决策 ， 起 到 协助 决策 者 进行 决策 的 作用 。 
2. 分 类 
根据 数据 建议 的 明确 性 不 同 ， 辅 助 决策 可 分 为 执行 性 辅助 决策 和 启发 性 辅助 决策 。 
(1) 执行 性 辅助 决策 
执行 性 辅助 决策 是 指 面 对 某 一 决策 主题 ， 可 以 用 确定 的 语言 进行 描述 ， 并 通过 特定 的 方法 和 模型 进行 分 析 挖 扎 ， 以 直接 的 数据 记录 、 行 动 规 则 等 辅助 决策 方 开始 业务 动作 。 
执行 性 辅助 决策 的 特征 是 : 具有 明显 的 决策 目的 ， 数 据 结果 明确 和 且 直 接 ， 业 务 决策 方 可 直接 采用 其 结果 并 落地 到 业务 执行 。 
举例 : 某 业 务 需要 针对 部 分 客户 进行 大 型 活动 以 实现 促销 ， 此 时 需要 确定 促销 客户 的 名 单 ， 如 果 数 据 从 业者 提供 了 客户 名 单 、 样 本 抽取 规则 等 ， 可 以 直接 帮助 业务 确定 发 送 对 象 。 
(2) 启发 性 辅助 决策 


启发 性 辅助 决策 相对 于 执行 性 辅助 决策 而 言 ， 可 能 没有 面 对 某 一 决策 主题 ， 也 可 能 是 面 对 某 一 决策 主题 时 没有 明确 的 结果 论断 ， 但 提供 了 间接 的 数据 相关 论证 、 规 则 、 描 述 等 ， 需 要 业务 自身 根据 这 些 
信息 进行 自我 判断 和 决策 。 


启发 性 辅助 决策 的 特征 是 : 决策 主题 不 明确 或 在 明确 的 决策 主题 下 没有 明确 的 业务 落地 点 ， 决 策 方 无 法 直接 开展 业务 活动 。 
举例 : 日 常 的 统计 性 数据 报告 、 面 向 市 场 研究 类 的 宏观 报告 都 属于 此 类 范畴 。 
3 步骤 
辅助 决策 的 步骤 通常 分 为 4 步 : 
1) 建立 决策 主题 。 业 务 方 基于 需求 或 问题 形成 决策 主题 ， 包 括 问题 组 成 、 决 策 方向 、 决 策 方法 、 实 施 周期 、 效 果 评 测 等 ， 这 是 决策 活动 的 起 点 . 
2) 分 析 决策 主题 。 数 据 从 业者 利用 相关 数据 知识 、 工 具 、 技 能 来 定性 分 析 和 挖 握 决策 主题 ， 并 得 出 可 供 决策 方 应 用 的 描述 或 结果 。 
3) 评估 决策 建议 。 决 策 方 根据 个 人 才能 、 经 验 、 流 程 以 及 所 处 环境 的 条 件 等 因素 对 描述 或 结果 进行 评估 ， 从 而 确定 最 优 方案 。 
4) 决策 实施 。 决 策 方 落地 决策 建议 并 开展 业务 动作 。 
辅助 决策 往往 不 是 一 次 性 工作 ， 而 是 一 个 笑 代 优化 的 过 程 。 每 一 次 决策 实施 既是 上 一 次 辅助 决策 的 终点 又 是 下 一 次 辅助 决策 的 开始 . 
1.4.2 ”数据 驱动 
1 含义 
数据 驱动 是 指 整 个 业务 运作 流程 以 数据 结果 为 运作 目标 ， 以 关键 数据 为 触发 方式 ， 借 助 计算 机 相关 技术 结合 企业 内 部 流程 和 机 制 形成 数据 一 体 化 的 工作 流程 。 
2 分 类 
按照 自动 化 程度 的 不 同 ， 数 据 驱动 分 为 自动 化 数据 驱动 及 半自动 化 数据 驱动 
(1) 自动 化 数据 驱动 


自动 化 数据 驱动 指数 据 业 务 流程 ， 从 确定 决策 目标 、 决 策 分 析 、 决 策 评估 到 决策 执行 过 程 都 是 完全 自动 化 的 驱动 方式 。 自 动 化 数据 驱动 的 核心 是 整个 过 程 除 了 人 为 调 参 优化 或 加 入 人 工 干预 规则 之 外 ， 
不 需要 借助 其 他 业务 方 的 参与 。 


举例 : 常见 的 站 内 个 性 化 推荐 系统 是 自动 化 数据 驱动 的 典型 应 用 ， 站 内 个 性 化 推荐 系统 实现 了 数据 自我 决策 实施 的 整个 过 程 ， 除 了 调 优 和 人 工 干 预 规则 外 ， 无 须 人 工 介 入 执行 。 
(2) 半自动 化 数据 驱动 
相对 于 自动 化 驱动 过 程 ， 半 自动 化 数据 驱动 需要 人 工 介 入 ， 主 要 介入 点 是 人 工 代 蔡 机 器 或 系统 触发 业务 动作 ， 但 业务 方 的 角色 是 仅 作 为 实施 方 介入 ， 不 参与 决策 过 程 。 


举例 : 大 多 数 电 子 商 务 网 站 都 有 基于 加 入 购物 车 事件 的 触发 机 制 ， 当 登录 或 注册 的 用 户 将 商品 加 入 购物 车 但 放弃 购买 后 ， 会 自动 帮 送 短信 或 邮件 提醒 用 户 继续 购买 ， 并 附 以 折扣 、 限 时 、 优 惠 券 等 措施 
刺激 用 户 完 成 订单 。 部 分 公司 由 于 整个 系统 并 未 完全 打通 ， 因 此 其 中 的 客户 名 单 需 要 人 工 梳理 后 录入 发 送 平台 ， 进 而 完成 整个 提示 过 程 。 


3. 步 骤 


数据 驱动 的 步骤 与 辅助 决策 相同 ， 只 不 过 在 建立 决策 主题 、 分 析 决 策 主题 、 评 估 决 策 建 议和 决策 实施 过 程 中 都 是 由 配合 数据 开发 的 自动 化 系统 来 完成 的 ， 整 个 决策 的 载体 是 自动 化 系统 ， 核 心 是 数据 本 
身 。 


1.4.3 ”辅助 决策 与 数据 驱动 差异 点 
辅助 决策 和 数据 驱动 是 两 个 层次 的 数据 应 用 ， 数 据 驱 动 相对 于 辅助 决策 的 实现 难度 更 高 、 数 据 价值 体现 更 大 。 
. 辅助 决策 为 业务 决策 方 服务 ， 整 个 过 程 都 由 业务 人 员 掌 控 ， 数 据 是 辅助 角色 。 


* 数据 驱动 的 过 程 由 数据 掌控 ， 数 据 是 主体 ， 实 现 该 过 程 需要 自动 化 系统 、 算 法 等 支持 。 因 此 ， 数 据 驱 动 具有 自主 导向 性 、 自 我 驱动 性 和 效果 寻 向 性 的 特征 。 由 于 数据 本 身 会 存在 缺陷 以 及 业务 需求 ， 
需要 在 数据 的 运作 过 程 中 加 入 人 工 干 预 因 素 。 但 数据 作为 数据 驱动 的 核心 不 变 ， 数 据 即 决策 本 身 。 


1.5 本章 小 结 


本 章 围绕 网 站 数据 分 析 的 认 知 话题 ， 全 面 介绍 了 网 站 数据 分 析 观 。 其 中 需要 读者 重点 掌握 的 知识 点 如 下 : 
* 网 站 数据 分 析 不 只 是 网 站 数据 的 输出 ， 更 是 为 企业 整体 及 所 有 网 站 上 下 游 业务 提供 数据 洞察 的 支持 载体 ; 
* 科学 认识 网 站 数据 分 析 ， 其 存在 价值 受 数据 特点 、 业 务 需求 及 其 他 客观 因素 的 影响 ; 

识别 网 站 数据 的 三 种 其 骗 形态 ， 尤 其 要 重视 第 三 种 ， 否 则 数据 产生 的 消极 作用 可 能 会 大 于 积极 作用 。 
此 外 ， 和 希望 读者 能 进一步 思考 以 下 问题 : 

* 网 站 数据 服务 的 对 象 是 否 比 较 单一 ， 如 果 是 ， 应 如 何 改 善 并 扩展 网 站 数据 发 挥 价值 的 领域 和 方式 ? 


` 网 站 数据 分 析 是 否 存在 上 其 骗 的 场景 ， 如 果 是 ， 应 如 何 尽 量 避免 并 弥补 这 种 问题 ? 


` 企业 数据 的 角色 到 底 是 辅助 决策 还 是 数据 驱动 ， 有 哪些 方法 让 数据 从 “后 台 ” 的 辅助 角色 转变 为 “前 台 ” 的 驱动 角色 ? 


第 2 草 ”从 零 开始 建立 企业 数据 体系 


完善 的 数据 工作 体系 是 数据 在 企业 内 发 挥 价值 的 基本 前 提 ， 很 多 企业 往往 缺乏 正确 的 认 知 和 明确 的 体系 方法 论 ， 认 为 招 几 个 分 析 师 就 能 建立 数据 工作 体系 。 这 种 错误 认 知 会 直接 导致 整个 数据 体系 的 不 
完善 性 ， 导 致 数据 工作 过 程 中 问题 百出 ， 从 而 影响 数据 价值 的 体现 ， 甚 至 会 导致 企业 数据 泄露 ， 影 响 企业 数据 的 安全 。 


企业 数据 体系 由 企业 职能 架构 保障 ， 通 过 职能 架构 与 技术 架构 协同 发 挥 作 用 。 本 章 将 介绍 企业 如 何 定位 数据 体系 ， 如 何 建立 完善 的 数据 智能 与 数据 技术 架构 体系 。 另 外 ， 企 业 在 建立 数据 体系 之 初 通常 
需要 引入 外 部 公司 协助 工作 ， 部 分 公司 也 会 采用 SAAS 的 服务 模式 ， 因 此 本 章 也 将 介绍 不 同 模式 的 优 务 及 如 何 选择 服务 供应 商 。 


2.1 ”数据 价值 最 大 化 的 定位 


2.1.1 数据 价值 定位 的 基本 原则 


数据 价值 定位 即 定位 数据 在 企业 内 部 的 角色 ， 其 决定 了 后 期 整个 数据 体系 的 工作 方向 和 价值 方向 。 
1. 拒 绝 “ 鸡 肋 ”工作 


所 谓 “ 鸡 肋 ”工作 就 是 业务 方 懒得 执行 的 工作 ， 特 点 是 需要 消耗 大 量 时 间 、 工 作 内 容 较为 初级 、 无 技术 含量 仅 靠 体力 完成 。 此 类 工作 通常 是 业务 与 数据 分 工 的 交叉 点 ， 即 业务 方 和 数据 方 都 可 以 执行 ， 
常见 的 工作 包括 数据 清洗 、 数 据 提取 、 数 据 汇 总 等 。 


此 类 工作 严格 意义 上 属于 基本 的 数据 统计 范畴 ， 很 多 公司 已 经 通过 自动 化 报表 工具 或 智能 系统 实现 这 类 工作 而 无 须 人 工 参 与 。 但 对 于 未 实现 自动 化 和 智能 化 的 公司 ， 只 能 人 工 实 现 。 如 果 仅 将 数据 价值 
定位 于 此 ， 数 据 工 作 其 实 是 低 价值 工作 的 外 包 承 接 者 ， 宫 无 意义 可 言 。 


但 从 企业 分 工 的 角度 来 看 ， 数 据 统计 类 工作 是 数据 工作 的 “分 内 之 事 ”， 并 且 是 每 个 公司 的 基本 工作 之 一 ， 那 么 作为 与 数据 相关 的 部 门 应 如 何 处 理 此 类 工作 呢 ? 

“ 时 间 把 控 。 此 类 工作 占用 的 整体 数据 工作 时 间 不 宜 超过 20%， 和 否则 数据 工作 将 被 大 量 初级 工作 束缚 ， 此 时 需要 借助 技术 手段 实现 自动 化 。 

需求 过 滤 。 不 是 所 有 的 数据 需求 都 是 有 价值 的 ， 部 分 业务 的 数据 需求 可 能 只 是 “ 拍 脑袋 ”提出 而 无 实际 价值 ， 对 于 此 类 需求 可 以 考虑 驳回 ， 把 时 间 留 给 具有 明确 目的 导向 和 高 价值 回报 意义 的 需求 。 
` 流程 建设 。 在 企业 内 部 需要 建立 数据 工作 流程 和 机 制 ， 不 同 的 需求 如 何 流转 、 审 批 ， 权 限 如 何 申请 需要 有 规 可 依 ， 很 多 零散 需求 可 以 通过 流程 化 管理 加 以 避免 。 


培训 建设 。 对 于 很 多 具有 明确 意义 的 基础 需求 ， 可 能 由 于 业务 方 不 具备 数据 能 力 而 无 法 完成 。 因 此 数据 体系 的 重要 工作 之 一 是 建立 企业 内 部 数据 培训 和 沟通 体系 ， 真 正 帮 助 业务 人 员 提 高 基本 数据 素 
质 和 数据 能 力 。 数 据 培训 建设 是 数据 发 挥 价值 的 重要 方式 ， 真 正 的 数据 驱动 型 企业 必定 是 每 个 业务 人 员 都 具有 数据 意识 和 数据 能 


很 多 公司 都 有 这 样 一 个 部 门 : 专门 负责 管理 用 户 数据 权限 ， 根 据 用 户 需求 提取 数据 。 这 个 部 门 通常 属于 技术 中 心 的 下 属 部 门 ， 以 公司 的 名 义 管 理 公司 数据 。 


这 种 工作 源 于 企业 内 部 数据 安全 性 的 需要 ， 企 业 试 图 通过 严格 的 数据 权限 管理 来 把 控 数 据 输 入 和 输出 ， 以 保证 数据 质量 稳定 和 内 部 数据 不 被 泄露 。 对 于 很 多 公司 尤其 是 大 型 公司 或 上 市 公司 ， 数 据 安全 
是 开展 所 有 数据 工作 的 先决 条 件 ， 在 无 法 保证 数据 安全 的 前 提 下 ， 任 何 数据 权限 都 不 开放 。 没 有 数据 ， 数 据 工作 就 是 无 源 之 水 、 无 本 之 木 ， 数 据 工作 无 从 谈 起 。 


企业 的 数据 安全 非常 重要 ， 数 据 安全 管理 是 数据 工作 的 重要 环节 。 但 如 果 只 是 局 限于 日 常数 据 处 理 ， 仅 仅 将 数据 工作 定位 于 保护 数据 安全 ， 那 么 数据 的 潜在 价值 便 无 法 发 挥 。 因 此 ， 企 业内 部 需要 建立 
在 保障 数据 安全 前 提 下 的 数据 权限 管理 机 制 和 流程 ， 通 过 适度 放权 把 注意 力 放 到 核心 业务 上 。 


3. 天 注 核心 业务 


在 第 1 章 我 们 提 到 了 公司 基因 是 决定 数据 价值 的 外 部 因素 ， 但 在 无 法 改变 公司 基因 的 条 件 下 ， 数 据 要 发 挥 价值 就 一 定 要 “主动 ”关注 和 “覆盖 ”公司 核心 业务 体系 ， 并 通过 数据 洞察 为 核心 业务 提供 价值 
导向 ， 否 则 数据 工作 将 游离 在 可 有 可 无 的 边缘 。 


以 下 是 数据 应 用 最 多 的 几 类 公司 的 核心 业务 。 

* 销售 类 公司 的 核心 业务 是 采购 和 销售 ， 核 心 关 注 点 是 流水 和 利润 率 。 
. 平台 类 公司 的 核心 业务 是 商家 和 客户 ， 核 心 关注 点 是 流水 和 佣金 。 

. 营销 类 公司 的 业务 核心 是 流量 和 客户 ， 核 心 关注 点 是 成 本 和 转化 。 


- 纸 媒 类 公司 的 核心 业务 是 广告 和 用 户 ， 核 心 关注 点 是 广告 和 改行。 


合 尘 总 所 有 公司 最 关注 的 核心 数据 都 是 利润 ， 不 同 公司 由 于 其 业务 模式 的 差异 ， 利 润 的 来 源 方式 和 计算 方法 不 同 。 核 心 的 利润 指标 首先 是 财务 体系 中 的 收入 减 去 党 用 后 的 净 额 ， 直 接 计 入 当期 利润 的 
利得 和 损失 ， 其 次 才 是 业务 体系 中 的 差价 利润 。 但 不 同 公司 在 不 同 发 展 阶段 其 核心 关注 点 会 有 所 不 同 ， 例 如 电 商 类 公司 前 期 更 关注 流量 规模 、 流 水 规模 、 正 常 现金 流 等 ， 后 期 才 关 注 盈 利 能 力 、 交 现 能 力 、 


负债 能 力 等 。 
2.1.2 ”数据 价值 的 4 种 剃 见 定位 


在 日 常 工 作 中 和 数据 产 出 中 ， 数 据 价值 的 定位 分 为 4 种 : 数据 管理 、 数 据 日 常 报表 、 数 据 专 项 挖掘 分 析 、 数 据 驱 动 。 几 乎 所 有 企业 的 数据 价值 定位 都 脱离 不 了 这 4 种 ， 差 异 只 是 不 同 定位 间 的 权重 不 同 而 
已 。 


1 数据 管理 
数据 管理 工作 包括 : 数据 配置 管理 、 数 据 权 限 管 理 、 用 户 权限 管理 、 数 据 导入 管理 、 数 据 导 出 管理 。 
“ 数据 配置 管理 。 数 据 存储 、 安 全 、 排 除 设置 ， 并 发 控制 、 进 程控 制 、 结 构 控 制 等。 


“ 数据 权限 管理 。 数 据 保存 、 新 增 、 删 除 、 更 新 、 备 份 、 合 并 、 折 分、 导出、 打印 等 。 


by 


" 用 户 权限 管理 。 用 户 新 增 、 删 除 、 重 置 、 过 期 设置 、 共 享 等 。 

* 数据 导入 管理 。 数 据 导 入 格式 、 时 间 、 和 条件、 规则、 异常 处 理 、 记 录 数 、 来 源 等 。 
* 数据 导出 管理 。 数 据 导出 格式 、 时 间 、 条 件 、 规 则 、 记 录 数 、 加 密 、 位 置 等 。 

2. 数 据 日 常 报表 


大 多 数 的 数据 日 常 报表 需要 通过 技术 开发 形成 报表 产品 体系 ， 以 提供 对 日 常 业务 的 支持 。 当 具有 突 发 性 事件 或 活动 时 ， 需 要 人 工整 理 和 汇总 报表 。 完 成 日 常 报表 后 ， 通 过 自动 发 送 邮件 或 短信 、 人 在线 访 
问 、 离 线 客户 端 访问 等 形成 接 入 数据 。 


根据 数据 日 常 报表 提供 频率 和 周期 的 不 同 ， 报 表 可 分 为 日 报 、 周 报 、 月 报 、 季 报 、 半 年 报 和 年 报 。 报 表 的 内 容 因 公司 需求 而 异 ， 但 基本 框架 是 统计 周期 内 企业 各 个 运营 环节 KPI 陈列 、 对 比 和 简单 分 析 ， 
目的 是 通过 周期 性 数据 进行 业务 诊断 ， 发 现 业务 效果 的 趋势 和 异常 点 ， 为 业务 的 优化 执行 提供 基本 支持 。 


根据 数据 日 常 报表 支 持 对 象 在 企业 内 部 分 工 的 不 同 ， 日 常 报表 可 分 为 针对 决策 层 的 报表 和 针对 执行 层 的 报表 。 针 对 决策 层 的 报表 侧重 于 宏观 的 、 整 体 的 效果 汇总 和 结果 把 脉 ， 借 助 对 比 、 趋 势 和 主要 维 
度 下 钻 等 方式 进行 初步 分 析 并 定位 结论 和 间 题 点 ; 针对 执行 层 的 报表 侧重 于 微观 的 、 个 体 的 效果 分 析 ， 各 业务 执行 层 只 针对 各 自 业 务 维度 进行 分 析 ， 并 提供 实际 可 行 的 操作 型 建议 。 


全 汪 癌 对 于 数据 指标 的 设 定 ， 既 要 包括 公司 核心 结果 指标 如 利润 ， 又 要 包括 各 个 业务 节点 的 过 程 类 或 间接 辅助 类 指标 ， 以 便 更 全 面 地 评估 和 定性 整体 及 各 业务 线 的 工作 结果 。 
3. 数 据 专项 挖掘 分 析 

数据 专项 挖掘 分 析 是 指针 对 某 一 特定 课题 或 需求 ， 采 用 专项 分 析 或 长 期 课题 分 析 的 形式 对 数据 进行 深入 挖掘 和 分 析 ， 以 提炼 出 相应 结果 或 方法 论 供 业务 参考 或 使 用 。 

数据 专项 挖掘 分 析 是 数据 发 挥 价值 的 重要 手段 ， 更 是 数据 辅助 支持 作用 的 关键 ， 大 多 数 公司 的 数据 工作 意义 都 来 源 于 此 。 


为 了 提高 数据 工作 的 针对 性 ， 数 据 专 项 挖掘 通常 按 业务 模块 划分 ， 常 见 的 数据 专项 挖 握 分 析 模 块 包括 市 场 分 析 、 营 销 分 析 、 网 站 分 析 (运营 分 析 ) 、 会 员 分 析 、 用 户 体验 分 析 、 销 售 分 析 、 移 动 分 析 、 
O20 分 析 等 。 不 同 分 析 模 块 课题 依 业务 需求 而 定 。 


4. 数 据 驱 动 
数据 驱动 是 真正 让 数据 从 辅助 角色 转变 为 决定 角色 的 唯一 方式 ， 但 数据 驱动 通常 在 其 他 数据 支持 体系 建立 并 完善 后 才 进 行 考虑 。 
第 一 ， 数 据 驱 动 需 要 成 熟 的 数据 方法 论 的 支持 ， 这 些 知识 需要 通过 日 常 报表 、 专 项 挖掘 分 析 等 方式 慢 慢 积 累 ， 即 使 外 部 引入 的 方法 论 也 需要 根据 企业 环境 进行 “定制 开发 ”。 


第 二 ， 数 据 驱 动 需 要 企业 内 部 具有 需求 环境 。 数 据 需要 的 前 期 以 辅助 决策 类 为 主 ， 第 一 步 是 “看 ”数据 的 需求 ， 即 数据 报表 ; 第 二 步 是 “ 碍 ”数据 的 需求 ， 即 通过 专项 挖掘 输出 数据 价值 ; 第 三 步 才 
“用 ”数据 的 需求 ， 即 让 数据 自己 决定 业务 方向 。 没 有 前 两 步 做 铺垫 ， 第 三 步 无 法 实现 。 


和 


第 三 ， 数 据 驱 动 需 要 较 大 的 IT、 人 力 、 物 力 和 财力 投入 ， 在 数据 工作 前 期 ， 尤 其 在 没有 见 到 数据 价值 产 出 之 前 ， 企 业 言 目 投 入 的 风险 性 大 。 


2.2 ”企业 数据 的 职能 架构 与 组 成 
企业 数据 的 职能 架构 指数 据 在 企业 内 从 企业 人 力 资源 角度 进行 的 架构 划分 ， 良 好 的 数据 职能 架构 是 保证 数据 发 挥 价值 的 组 织 基础 。 
2.2.1 企业 内 部 的 职能 架构 


常见 的 企业 内 部 的 职能 架构 有 三 种 形式 : 分 散 型 数据 架构 、 集 中 型 数据 架构 和 复合 型 数据 架构 。 


在 分 散 型 数据 架构 中 ， 数 据 作为 单独 的 部 门 位 于 各 业务 中 心 之 下 ， 职 责 是 提供 本 中 心 的 数据 支持 。 如 图 2-1 所 示 ， 营 销 中 心 、 运 营 中 心 、 会 员 中 心 、 采 销 中 心 和 IT 中 心 都 有 自己 的 数据 部 门 ， 各 部 门 相互 


-世贸 


二 


数据 部 门 数据 部 门 数据 部 门 数据 部 门 


图 2-1 分 散 型 数据 架构 
分 散 型 数据 架构 常见 于 企业 创建 数据 体系 的 初期 ， 初 囊 是 先 将 数据 置 于 某 个 中 心 之 下 ， 待 数据 工作 正常 开展 并 卓有成效 之 后 ， 再 在 其 他 部 门 成 立 数据 部 门 并 辅助 业务 工作 。 


这 种 数据 架构 的 优势 非常 明显 : 前 期 投入 较 小 ， 只 需 人 员 成 本 和 极 少 的 系统 成 本 便 可 开展 工作 ; 数据 从 业 人 员 由 于 处 于 业务 工作 体系 内 ， 对 业务 熟悉 度 较 高 ， 数 据 落 地 价值 更 大 ; 另外， 相同 体系 下 的 
各 个 部 门 协 同 工 作 效率 更 高 ， 利 于 业务 方 的 数据 理解 和 执行 。 当 然 ， 这 种 架构 的 缺点 也 显而易见 : 


. 数据 质量 难以 保证 。 各 部 门 数 据 来 源 分 散 且 不 完整 ， 数 据 质量 难以 保证 ， 基 于 未 知 质量 上 的 数据 结论 可 能 无 法 立足 。 


- 数据 共享 困难 。 不 同 数据 部 门 之 间 的 数据 孤立 还 会 导致 数据 孤岛 的 出 现 ， 不 同 的 思维 方法 、 工 作 机 制 ， 甚 至 定义 方法 不 同 导 臻 数据 源 和 数据 结果 无 法 共享 。 比 如 对 于 转化 率 的 定义 方法 ， 可 能 有 订 
单 /UV， 订 单 /访问 ， 订 单 客户 /UV 其 至 件数 /PV。 数 据 共享 困难 一 方面 造成 数据 价值 难以 最 大 化 传播 ， 另 一 方面 也 造成 一 定 的 人 力 、 时 间 和 物资 的 浪费 。 


数据 结果 混乱 。 由 于 数据 来 源 不 一 致 或 同一 来 源 下 口径 的 不 同 ， 各 个 业务 部 门 汇报 的 结果 可 能 导致 数据 有 出 入 。 这 会 影响 决策 层 对 业务 结果 的 判断 ， 同 时 影响 数据 的 可 信 度 。 
* 难以 形成 合力 。 各 部 门 基于 自身 的 需求 搭建 支持 体系 ， 不 同 部 门 间 难以 形成 合力 来 共同 搭建 对 全 公司 服务 的 数据 支撑 点 。 


2. 集 中 型 数据 架构 
集中 型 数据 染 构 与 分 散 型 数据 架构 相反 ， 它 是 把 所 有 的 数据 工作 汇总 到 一 个 中 心 集中 统筹 规划， 通常 该 中 心 是 信息 技术 中 心 或 |T 中 心 。 图 2-2 展 示 了 典型 的 集中 型 数据 架构 图 。 


图 2-2 ”集中 型 数据 架构 
这 种 数据 架构 体系 有 效 地 解决 了 数据 源 不 一 致 和 和 数据 口径 定义 的 问题 。 由 于 所 有 数据 从 生产 到 应 用 都 由 该 中 心 统 一 负责 ， 数 据 质量 较 高 。 这 种 数据 架构 的 唯一 问题 是 业务 理解 与 支持 较 弱 : 
. 业务 工作 流程 复杂 。 所 有 业务 中 心 的 数据 需求 都 需要 经 过 该 中 心 处 理 ， 需 求 沟通 、 确 认 、 实 施 、 反 馈 的 流程 较为 复杂 ， 影 响 业 务 对 数据 需求 的 积极 性 与 主动 性 。 
: 业务 理解 度 不 够 。 在 该 中 心 统筹 下 的 数据 体系 ， 附 带 了 技术 的 思维 方式 和 工作 方式 ， 对 业务 的 理解 程度 低 ， 使 得 数据 难以 落地 应 用 。 
. 技术 响应 及 时 性 差 。 该 中 心 的 部 门 都 有 各 自 的 工作 计划 和 排 期 ， 业 务 方 多 而 杂 的 临时 需求 影响 其 正常 的 工作 ， 大 量 需求 可 能 被 积压 甚至 无 限 延期 。 
为 了 解决 集中 型 数据 架构 带 来 的 业务 应 用 问题 ， 行 之 有 效 的 一 种 方法 是 派驻 数据 分 析 师 到 各 个 业务 中 心 。 这 能 在 很 大 程度 上 缓解 技术 类 中 心 “不 懂 业 务 ” 的 被 动 局 面 ， 但 对 数据 分 析 师 个 人 素质 和 能 
有 较 高 的 要 求 : 
. 扎实 的 基本 数据 素质 。 分 析 师 需要 具有 扎实 的 基本 数据 素质 ， 能 及 时 、 有 效 、 准 确 地 解答 业务 数据 中 存在 的 问题 。 
. 良好 的 个 人 时 间 把 控 。 由 于 其 身 处 于 业务 中 间 ， 会 面临 很 多 临时 需求 ， 包 括 咨 询 、 取 数 、 分 析 、 报 告 等 ， 这 要 求 分 析 师 能 具有 良好 的 个 人 时 间 管 理 素质 。 


. 完善 的 工作 流程 和 机 制 。 流 程 和 机 制 可 以 使 各 项 工作 有 据 可 依 ， 在 过 滤 无 效 需 求 的 同时 保证 数据 安全 性 、 有 效 性 、 及 时 性 和 落地 应 用 价值 。 


上 述 方式 可 以 有 效 保证 数据 质量 和 业务 应 用 效果 ， 但 我 们 需要 同时 考虑 数据 之 外 的 问题 : 如 何 管理 分 散 到 各 个 业务 中 心 的 人 员 ” 如 何 协同 各 部 门 的 工作 ”如 何 避 免 交 叉 管 理 的 问题 ? 
人 @; 谤 在 集中 型 数据 架构 下 ， 分 散 到 各 业务 中 心 的 分 析 师 的 组 织 架 构 仍 然 属于 技术 中 心 。 
3. 复 合 型 数据 架构 


复合 型 数据 架构 是 建立 在 分 散 型 和 集中 型 数据 架构 基础 上 的 复合 组 织 架 构 。 数 据 端 集中 到 统一 中 心 之 下 管理 ， 该 中 心 通常 是 IT 或 数据 中 心 ; 业务 端 分 散 到 各 业务 中 心 之 下 设立 数据 支持 部 门 ， 如 图 2-3 所 


人 小。 


IT 数据 中 心 


数据 部 门 数据 部 门 数据 部 门 乌 拓 齐 | 数据 管理 部 门 


数据 产品 部 门 


数据 挖 据 囊 门 


数据 智能 部 门 


图 2-3 ”复合 型 数据 架构 
复合 型 数据 架构 既 能 保证 数据 的 质量 标准 化 ， 又 能 保证 各 个 业务 节点 的 数据 落地 应 用 ， 同 时 还 可 以 结合 各 业务 共同 需求 及 公司 战略 发 展 需求 开发 全 局 应 用 的 智能 产品 。 下 面 介 绍 不 同 中 心 的 分 工 。 
(1) IT/ 数 据 中 心 
IT/ 数 据 中 心 的 数据 职能 是 对 接 全 公司 所 有 业务 的 高 级 需求 ， 统 筹 整体 并 进行 相关 数据 的 产品 开发 : 
` 统一 口径 。 数 据 源 的 定义 、 数 据 出 口 和 抽取 逻辑 的 统一 、 数 据 指标 和 应 用 场景 的 规范 等 。 
* 搭建 平台 。 通 过 数据 整合 、 清 洗 和 计算 ， 提 供 数据 自由 抽取 、 访 问 及 可 视 化 的 工作 平台 。 
. 智能 数据 产品 开发 。 自 动 化 数据 挖掘 模 型 的 封装 和 开发 、 商 务 智能 (BI) 、 个 性 化 推荐 等 。 
` 对 接 业 务 中 心 高 级 需求 。 深 度数 据 源 抽取 和 应 用 、 数 据 建 模 和 挖掘 技术 支持 等 。 
* 数据 技能 培训 。 提 高 业务 数据 应 用 能 力 和 素养 ， 包 括 知识 、 技 能 、 素 质 、 最 佳 实践 场景 推广 等 ,涵盖 数 据 知 识 、 数 据 应 用 和 工具 使 用 知识 。 
(2) 各 业务 中 心 
各 业务 中 心 除 对 接 各 自 中 心 的 需求 以 外 ， 还 需要 与 |T/ 数 据 中 心 协同 工作 : 


* 根据 数据 中 心 的 统一 规范 ， 制 订 适 合 本 中 心 的 数据 应 用 场景 、 指 标 和 分 析 体系 等 ; 


- 收集 各 自 中 心 的 零散 需求 并 反馈 到 IT/ 数据 中 心 ， 参 与 TI/ 数据 中 心 公司 级 数据 产品 的 开发 和 应 用 ， 参 与 的 环节 包括 底层 收集 、 数 据 ETL、 数 据 建 模 、 数 据 可 视 化 、 数 据 智 能 应 用 等 
据 协同 工作 的 重要 输出 。 


该 项 工作 是 数 


2.2.2 ”企业 外 部 的 职能 架构 


很 多 企业 在 搭建 数据 体系 的 过 程 中 ， 由 于 自身 经 验 不 足 及 内 部 经 营 体 系 的 限制 ， 都 会 引入 第 三 方 服务 公司 进行 合作 甚至 会 采用 SAAS 服 务 模式 。 这 种 合作 形式 既 能 减少 企业 前 期 数据 运营 的 风险 ， 又 能 供 


鉴 其 他 行业 优秀 案例 快速 搭建 适合 本 企业 的 数据 体系 。 
1. 与 第 三 方 数据 公司 合作 


企业 与 第 三 方 数据 公司 的 合作 内 容 可 以 包含 所 有 数据 环节 ， 包 括 数据 采集 程序 开发 、 数 据 存储 、 数 据 整合 、 数 据 挖掘 分 析 、 数 据 可 视 化 和 数据 智能 产品 等 ， 合 作 方式 通常 是 第 三 方 数据 公司 以 驻 场 的 形 
式 进 入 企业 内 部 ， 协 助 企 业 进 行 封闭 式 开 发 。 


这 种 合作 方式 可 以 充分 利用 第 三 方 数 据 公司 的 行业 经 验 ， 帮 助 企业 快速 搭建 数据 体系 并 通过 阶段 性 的 项 目 输出 降低 项 目 风险 ， 同 时 也 可 以 将 企业 需求 融合 到 数据 体系 搭建 和 产品 开发 中 ， 从 而 建立 适合 
企业 需求 的 数据 体系 。 因 此 ， 这 是 一 种 快速 、 有 效 、 安 全 的 实现 方式 。 


国内 有 许多 优秀 的 数据 服务 公司 可 供 选 择 ， 在 此 不 推荐 数据 公司 ， 只 提供 一 些 关 键 点 供 大 家 选择 数据 服务 时 参考 : 
合作 案例 ， 尤 其 是 同行 业 的 案例 。 

* 驻 场 服务 ,保障 数据 安全 的 同时 又 能 集中 资源 快速 完成 项 目 。 

“ 专业 数据 技术 和 经 验 ， 数 据 采 集 、 存 储 、 整 合 、 挖 据 、 可 视 化 、 产 品 开 发 等 都 需要 不 同 的 专业 技术 和 经 验 要 求 。 
" 数据 服务 专业 性 和 严谨 性 ， 严 谨 的 态度 和 专业 的 服务 水 平 是 数据 项 目 成 功 的 保障 。 

2.SAAS 


SAAS， 软 件 即 服务 ， 它 使 企业 直接 向 服务 商 租 用 基于 Web 的 软件 ， 服 务 商 提供 软件 管理 和 维护 ， 企 业 只 需 通 过 在 线 访问 相关 系统 来 管理 企业 的 经 营 活动 。 SAAS 通 常 被 中 小 型 企业 采用 ， 或 是 企业 发 展 
前 期 使 用 的 解决 方案 。 目 前 主流 的 网 站 分 析 系 统 都 是 以 SAAS 服 务 模式 为 主 ， 如 Google Analytics ( 含 免费 版 和 付费 GAP) 、Webtrekk、Adobe Analytics 等 。 


对 于 企业 来 说 ， 采 用 SAAS 模 式 的 优点 突出 : 
" 人 员 和 技术 投入 少 。 企 业 无 需 单 独 配备 II 运 维 、 技 术 开 发 等 专业 技术 人 员 ， 同 时 又 能 得 到 最 新 的 技术 支持 ， 满 足 企 业 对 信息 管理 的 需求 。 


一 次 性 费用 投入 少 。 企 业 只 需 以 相对 较 低 的 费用 即 可 投入 生产 ,一 次 性 投入 成 本 较 低 ， 部 分 SAAS 服 务 商 还 允许 “分 期 付费 ”， 减少 了 企业 资金 的 占用 。 


* 后 期 维护 和 管理 的 费用 低 。 由 于 企业 实际 上 是 租赁 服务 商 的 软 硬 件 系 统 ， 所 有 系统 维护 和 基本 管理 工作 都 由 服务 商 提供 ， 企 业 无 须 派 驻 专门 的 人 力 进 行 运 维 ;同时 ， 软 硬件 系统 的 升级 、 折 旧 费 用 也 
无 需 考 虑 ， 减 少 了 软 硬 件 的 持续 投入 费用 。 


与 此 同时 ，SAAs 模 式 同样 存在 一 定 的 弊端 : 

SAAS 提供 的 是 基于 云端 的 标准 化 服务 套件 ， 难 以 满足 企业 个 性 化 的 发 展 需 求 。 

.数据 存放 于 云端 意味 着 数据 位 于 企业 外 部 ， 数 据 安全 性 需要 得 到 足够 的 重视 。 

` SAAS 系 统 与 其 他 系统 的 数据 兼容 和 整合 将 是 企业 后 期 面临 的 重要 问题 。 

企业 在 选择 SAAs 服 务 商 时 需要 综合 考虑 企业 内 外 部 的 环境 、 企 业 发 展 阶段 、 企 业 需求 等 。 在 大 多 数 情况 下 ， 除 了 选择 第 三 方 数据 公司 应 该 考虑 的 因素 外 ， 在 选 SAAs 服 务 商 时 还 要 注意 以 下 3 个 问题 : 


“ 数据 安全 与 权限 管理 。 企 业 数 据 安 全 是 数据 工作 的 重 中 之 重 ， 在 SAAS 服 务 下 数据 外 置 于 服务 商 的 云端 主机 。 除 了 常用 的 SSL 技 术 之 外 ，SAAS 服 务 商 还 需要 提供 数据 灾难 备份 、 数 据 访 问 权限 管理 、 数 
否 


据 加 密 和 控制 技术 等 ， 尤 其 重要 的 是 数据 是 否 会 以 其 他 形式 被 第 三 方 使 用 。 


数据 处 理 和 访问 效率 。SAAS 模 式 需 要 企业 通过 Web 访 问 数据 系统 ， 要 求 系统 具备 较 高 的 数据 处 理 和 访问 效率 ， 主 要 表现 在 海量 数据 下 的 并 发 量 限制 、 数 据 丢 包 问 题 、 数 据 处 理 效率 和 延迟 性 、 系 统 支 


持 的 同时 在 线 人 数 、 单 账号 并 发 量 、 网 络 访问 延迟 等 。 


* 系统 扩展 和 开发 特性 。SAAS 系 统 提供 的 服务 模块 通常 是 固定 的 ， 企 业 需 要 根据 自身 的 需求 做 定制 开发 。 如 果 SAAS 系 统 的 扩展 性 较 差 ， 可 开发 的 空间 小 ， 将 导致 整个 SAAS 系 统 中 的 数据 形成 数据 孤 
岛 ， 无 法 串联 到 其 他 业务 系统 和 数据 系统 中 ， 影 响 数 据 价值 的 有 效 发 挥 。 


在 选择 第 三 方 数 据 公 司 或 SAAS 服 务 模式 时 ， 不 要 只 关注 高 性 能 、 全 面 解决 方案 、 强 大 功能 套件 、 最 新 应 用 技术 等 方面 ， 要 结合 企业 的 实际 需求 进行 综合 考虑 ， 适 合 的 就 是 最 好 的 。 


2.3 ”企业 数据 技术 架构 与 组 成 


企业 数据 技术 架构 是 指 整 个 数据 体系 在 技术 管理 和 架构 中 的 组 成 体系 。 企 业 数 据 架 构 在 逻辑 上 按照 从 下 到 上 的 布局 ， 通 常 包括 数据 收集 层 、 数 据 存储 层 、 数 据 计 算 层 、 数 据 管 理 层 和 数据 应 用 层 ， 具体 
如 图 2-4 所 示 。 
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图 2-4 通用 企业 数据 技术 架构 逻辑 图 


2.3.1 数据 收集 层 


数据 收集 层 的 主要 工作 是 在 生产 环境 下 做 基础 数据 采集 。 该 数据 是 各 个 业务 工作 系统 生产 环境 直接 产生 的 原始 数据 ， 数 据 产生 后 存储 于 各 自 的 数据 系统 内 。 

1. 企 业内 部 数据 采集 

企业 内 部 数据 采集 来 源 于 各 个 业务 生产 系统 ， 包 括 CRM 数 据 、CC (呼叫 中 心 ) 数据 、 财 务 数据 、 仓 储 数据 、 门 店 数据 、 销 售 数据 、OA 数 据 、 物 流 数据 、 网 站 数据 。 

* CRM 数 据 ， 即 企业 客户 管理 系统 的 相关 数据 ， 包 含 客户 所 有 的 人 口 属性 、 订 单 属性 、 和 营销 属性 、 状 态 属性 、 标 签 属性 等 数据 。 

CC (呼叫 中 心 ) 数据 ， 即 企业 呼叫 中 心 系统 的 相关 数据 ， 包 含 语 音 数据 、 话 务 录 音 、 呼 叫 接 通 、 投 诉 等 数据 。 

财务 数据 ， 包 括 现金 流 、 资 产 管理 、 和 盈利 、 负 债 等 数据 ， 财 务 数 据 是 企业 数据 的 核心 ， 也 是 成 本 结算 的 最 终 依据 。 任 何 业 务 系 统 的 费用 、 考 核 、 结 算 都 要 以 财务 数据 的 核算 结果 为 准 。 
` 仓储 数据 ， 包 括 库 存 周转 、 库 存 结构 、 畅 销 、 滞 销 等 数据 。 仓 储 数 据 是 传统 品牌 商 和 渠道 商 企 业 运 转 的 关键 枢纽 。 

.门店 数据 ， 除 线 下 销售 外 ， 还 包括 POS 数 据 、 动 线 视频 数据 等 非 结 构 化 数据 。 

` 销售 数据 ， 包 括 渠 道 、 平 台 、 品 类 等 维度 的 销售 数据 。 销 售 数据 是 零售 企业 数据 的 核心 。 

. OA 数据 ， 是 企业 内 部 办 公 系 统 的 相关 数据 ， 该 数据 可 以 为 优化 企业 内 部 流程 服务 。 

. 物流 数据 ， 包 括 出 库 、 配 送 、 调 度 、 退 换 货 等 数据 。 

. 网 站 数据 ， 即 流量 数据 ， 包 括 网 站 所 有 营销 数据 、 用 户 数 据 、 运 营 数据 、 在 线 销售 等 行为 日 志 。 网 站 数据 量 庞大 且 大 多 是 半 结 构 化 数据 。 

2. 企 业 外 部 数据 采集 

企业 外 部 数据 是 指数 据 由 企业 外 部 产生 ， 企 业 通 过 合作 、 购 买 、 采 和 集 等 形式 获得 。 企 业 外 部 数据 通常 包括 竞争 数据 、 营 销 数据 、 物 流 数据 、 行 业 数 据 等 。 

竞争 数据 ， 通 常 是 通过 购买 或 程序 采集 等 形式 ， 获 得 关于 竞争 对 手 的 流量 、 销 售 、 产 品 、 营 销 等 方面 的 数据 ， 如 竞争 对 手 产 品 价 格 、 竞 争 对 手 会 员 数 据 、 和 营销 投放 渠道 等 。 
. 营销 数据 ， 指 企业 通过 营销 或 推广 合作 ， 获 取 自 身 或 站 外 相关 媒体 、 渠 道 的 曝光 、 点 击 、 投 放 等 详细 数据 。 

物流 数据 ， 指 第 三 方 的 物流 数据 。 


. 行业 数据 ， 指 通过 购买 、 调 研 等 获得 关于 市 场 整体 行情 、 市 场 趋势 、 用 户 结构 、 竞 争 环 境 等 信息 ， 常 见于 行业 报告 数据 。 


2.3.2 ”数据 仔 储 层 


数据 存储 层 是 在 数据 源 的 基础 上 ， 通 过 ETL 进 行 数据 整合 ， 形 成 供 上 层 计 算 或 业务 使 用 的 数据 仓库 及 数据 集 。 数 据 仓库 面向 业务 决策 或 上 层 数据 应 用 ， 是 一 个 面向 主题 的 、 集 成 的 、 相 对 稳定 的 、 反 映 历 
史 数 据 变化 的 数据 集合 。 


: 面向 主题 的 。 数 据 仓库 通常 面向 特定 的 主题 ， 并 围绕 主题 组 织 数据 。 

* 集成 的 。 数 据 仓 库 相 对 于 分 散 的 数据 源 ， 经 过 数据 抽取 、 转 换 、 加 载 等 数据 清洗 动作 得 到 一 个 集成 的 数据 集合 。 

“ 相对 稳定 的 。 数 据 仓 库 中 的 数据 相对 稳定 ， 不 会 涉及 频繁 的 数据 变化 操作 ， 如 删除 、 修 改 等 ， 主 要 的 数据 操作 是 加 载 、 抽 取 、 更 新 等 。 

“ 反映 历史 数据 变化 的 。 数 据 仓库 中 的 数据 是 历史 所 有 数据 的 集合 ， 因 此 能 够 反映 自 数据 仓库 搭建 以 来 企业 的 数据 趋势 ， 并 通过 定量 数据 反映 结果 。 

数据 仓库 从 物理 结构 上 看 通常 包括 数据 抽取 、 数 据 存储 和 数据 访问 三 部 分 。 

. 数据 抽取 。 数 据 仓库 通过 特定 的 方法 与 数据 源 关 联 ， 并 经 过 ETL (抽取 、 转 换 、 加 载 ) 完成 数据 抽取 和 处 理 过 程 。 

数据 存储 。 数 据 存储 是 数据 仓库 的 核心 ， 数 据 仓库 的 存储 结构 按照 组 织 方式 可 分 为 星 型 、 雪 花 型 、 复 合 型 等 ， 不 同 的 数据 仓库 结构 按照 第 一 范式 、 第 二 范式 ， 甚 至 是 第 三 范式 的 组 织 规则 构建 。 


数据 访问 。 数 据 仓库 的 最 终 目 的 是 供 上 层 应 用 ， 因 此 需要 具备 可 访问 性 。 数 据 仓库 的 主体 包括 上 层 数 据 计 算 需 求 及 业务 抽取 数据 ， 如 数据 挖 据 、 数 据 计 算 、 产 品 报表 、 数 据 驱 动产 品 、 辅 助 决策 产品 
和 临时 需 求 等 。 


合 尘 总 在 设计 数据 仓库 的 结果 时 既 要 考虑 到 底层 数据 宛 余 、 高 并 发 数据 可 访问 、 简 易 数 据 计算 和 相关 数据 主题 结构 ， 又 要 兼顾 业务 在 实际 应 用 中 的 便捷 性 和 可 理解 性 。 


2.3.3 ”数据 计算 层 


数据 计算 模块 是 整个 数据 架构 的 关键 点 ， 所 有 底层 数据 发 挥 作 用 都 需要 经 过 数据 挖掘 和 计算 框架 输出 。 数 据 计 算 层 既 要 通过 不 同 算法 满足 不 同 需求 的 挖掘 需要 ， 又 要 根据 数据 需求 尽 可 能 的 实时 输出 结 
果 。 


1. 数 据 挖掘 

数据 挖掘 按照 不 同 的 实现 结果 可 分 为 回归 模型 、 聚 类 模型 、 关 联 模型 、 时 间 序 列 、 分 类 模型 和 机 器 学 习 等 。 

(1) 回归 模型 

回归 模型 即 回归 分 析 ， 是 研究 自 变量 x 对 因 变 量 y 影 响 的 一 种 数据 分 析 方法 。 回 归 模型 可 以 表示 为 y=ax“+ bx+c， 其 中 y 为 因 变量 ，x 为 自 变量 ，a 和 b 为 影响 系数 ，c 为 截 距 。 


回归 分 析 的 优点 是 数据 结果 便于 理解 ， 如 线性 回归 用 y=ax+b 的 形式 表达 ， 在 解释 和 理解 自 变 量 与 因 变 量 的 关系 时 相对 比较 容易 。 回 归 分 析 是 广泛 应 用 的 统计 学 分 析 方 法 ， 主 要 用 于 分 析 其 中 一 方 对 另 
一 方 的 影响 关系 或 双方 的 影响 方向 〈 正 向 影响 还 是 负 向 影响 ) 。 


回归 分 析 按 照 自 变量 的 个 数 分 为 一 元 回归 模型 和 多 元 回归 模型 ;按照 影响 是 否 线性 分 为 线性 回归 和 非 线性 回归 。 如 图 2-5 所 示 是 一 个 典型 的 线性 回归 图 ， 显 示 了 自 变量 x (费用 ) 与 因 变 量 y (流量 ) 之 间 
的 关系 ， 两 者 的 关系 用 关系 式 表示 为 y=2.2072x+1.6831。 


图 2-6 所 示 是 一 个 典型 的 非 线性 回归 图 ， 显 示 了 自 变 量 x (流量 ) 与 y (CPC) 之 间 的 关系 ， 两 者 的 关系 可 用 y= 8.8645x-1“8 表 示 。 


回归 模型 的 特点 是 变量 间 的 关系 明确 ， 基 本 可 以 通过 视 党 判断 影响 是 正 向 还 是 负 向 ; 通过 函数 拟 合 出 来 的 模型 可 以 直接 应 用 到 业务 预测 实践 中 ， 方 便 业 务 理解 和 操作 。 回 归 分 析 的 缺点 是 只 能 分 析 少 数 
变量 之 间 的 相互 关系 ， 无 法 处 理 海量 数据 间 的 相互 关系 。 


只 用 与 流星 天 系 图 
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图 2-5 ”流量 随时 间 增 长 线性 图 


y= 8.8643x 28 
R2 =0.9646 


@ia 示 细心 的 读者 一 定 会 发 现在 图 2-5 和 图 2-6 中 都 有 “R2” 参 数 ，R“ 是 解释 系数 ， 意 思 是 拟 合 的 模型 中 因 变 量 能 被 解释 的 百分比 ， 例 如 ， 图 2-6 中 R2=0.9646 的 意思 是 拟 合 模型 y=8.8645x128 能 解释 


96.46% 的 变化 ， 还 有 3.54% 的 变化 无 法 通过 此 模型 解释 。R“ 的 值 越 大 代表 解释 模型 越 科 学 ，R“ 的 取 值 区 间 在 0~1 之 间 ， 即 最 大 值 为 1。 


聚 类 模型 即 聚 类 分 析 ， 是 根据 “ 物 以 类 聚 ”的 道理 ， 按 照 一 定 的 规则 将 大 量 数据 中 相似 或 相 邻 的 数据 归 为 一 类 的 数据 分 析 方 法 。 


聚 类 分 析 常 用 于 数据 探索 或 挖掘 初期 ， 是 在 没有 进行 数据 整体 分 析 之 前 进行 的 探索 性 分 析 ， 适 用 于 样本 量 较 大 情况 下 的 数据 初步 探索 。 比 如 针对 企业 整体 的 用 户 特 征 ， 在 未 得 到 相关 知识 或 经 验 之 前 先 
根据 数据 本 身 特 点 进行 用 户 分 群 ， 然 后 再 针对 不 同 群体 做 进一步 分 析 。 


聚 类 分 析 能 解决 的 问题 类 型 包括 : 目前 的 数据 集 可 以 分 为 几 类 、 每 个 类 别 有 多 少 样本 量 、 不 同类 别 中 各 变量 的 强 弱 关系 如 何 、 不 同类 别 的 典型 特征 是 什么 等 。 


聚 类 分 析 无 法 提供 明确 的 行动 指向 ， 聚 类 结果 更 多 的 是 为 后 期 的 数据 挖掘 和 分 析 工 作 提 供 参考 ， 无 法 回答 “为 什么 ”和 “怎么 办 ”的 问题 。 另 外 ， 原 始 数据 中 的 异常 值 需要 进行 特别 处 理 ， 否 则 会 直接 
影响 聚 类 结果 


聚 类 分 析 的 常用 模型 包括 K-Means 方 法 、K-Medoids 方 法 、CLARANS 方 法 、BIRCH 方 法 等 ， 每 种 方法 都 有 自身 的 适用 场景 。 
(3) 关联 模型 
关联 模型 是 从 大 量 的 数据 中 发 现 两 种 数据 之 间 关系 的 一 种 方法 。 关 联 分 析 的 典型 案例 是 “啤酒 和 尿布 ”的 捆绑 销售 ， 即 买 了 尿布 的 用 户 同 时 还 会 买 啤酒 。 


关联 规则 相对 其 他 数据 挖掘 模型 而 言 更 为 简单 ， 易 于 业务 的 理解 和 应 用 。 关 联 模型 的 典型 应 用 场景 是 购物 篮 分 析 ， 通 过 分 析 用 户 同时 购买 了 哪些 商品 来 分 析 用 户 的 购物 习惯 。 这 种 策略 还 会 应 用 于 捆绑 
销售 、 商 品 促销 设计 、 页 面 促销 设计 、 商 品 陈列 设计 、 商 品 价格 策略 和 基于 购买 的 用 户 特 征 分 析 等 ，Webtrekk 中 的 关联 分 析 报 表 即 应 用 了 关联 模型 。 


关联 规 则 的 问题 在 于 缺乏 考虑 时 间 因 素 ， 只 能 判断 同期 内 发 生 的 事务 ， 无 法 判断 两 种 事务 的 先后 顺序 。 比 如 ， 通 过 关联 分 析 可 以 得 出 用 户 通常 同时 购买 电视 和 冰箱 ， 但 无 法 确认 用 户 先 买 冰箱 还 是 先 买 
电视 ， 因 此 关联 规则 通常 适用 于 没有 明显 时 间 序 列 的 业务 应 用 场景 。 另 外 ， 对 于 支持 度 和 可 信 度 的 设置 都 要 根据 实际 业务 经 验 来 进行 调整 。 


关联 模型 中 最 常用 的 是 Apriori， 其 核心 是 基于 两 个 阶段 频 集 思想 的 递 推 算法 ， 该 关联 规则 在 分 类 上 属于 单 维 、 单 层 、 布 尔 关联 规则 ， 常 用 于 事务 性 的 挖掘 规则 中 (所 谓 事务 性 的 挖掘 规则 是 事件 间 的 关 
联 ， 无 事件 概念 ) ， 比 如 在 一 次 事件 中 通常 哪 两 种 事件 或 事物 一 起 发 生 。 图 2-7 显 示 了 购物 篮 中 客户 经 常会 购买 的 商品 ， 水 果蔬 菜 和 鱼 、 啤 酒 和 蔬菜 镀 头 、 白 酒 和 糕饼 的 关联 购买 性 较 强 。 


外 白酒 ”四 冻 肉 
1 国 栏 从 ”全 啤酒 
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图 2-7 客户 购物 篮 关 联 分 析 


(4) 时 间 序 列 
时 间 序 列 是 用 来 研究 数据 随时 间 变 化 趋势 的 数据 分 析 方 法 ， 时 间 序 列 与 回归 的 区 别 在 于 ， 时 间 序 列 缺乏 可 灵活 选择 的 自 变量 ， 唯 一 的 自 变 量 是 时 间 (小 时 、 日 、 周 、 月 等 ) 。 
时 间 序 列 通常 由 4 个 要 素 组 成 : 趋势 、 季 节 波动 、 循 环 波动 、 不 规则 波动 。 

` 趋势 ， 指 数据 随时 间 长 期 性 的 增长 或 下 降 的 趋势 。 

. 季节 波动 ， 指 在 一 年 内 随 季节 周期 的 波动 趋势 ， 如 节假日 、 季 节 周 期 等 。 

* 循环 波动 ， 指 在 若干 年 或 长 时 间 内 的 波动 趋势 ， 与 趋势 的 区 别 在 于 循环 波动 具有 周期 性 的 规律 ， 而 非 呈 现 单 一 方向 的 持续 变化 。 


.不 规则 波动 ， 指 异常 情况 、 突 发 性 事件 导致 的 异常 波动 。 


侠 软 饮料 四 蔬菜 饶 头 


时 间 序 列 常 应 用 于 异常 数据 检验 、 数 据 效果 周期 性 预测 等 ，Adobe Analytics 中 的 异常 检测 报告 即 应 用 了 时 间 序 列 的 相关 模型 和 算法 ， 其 他 应 用 场景 与 回归 模型 类 似 。 时 间 序 列 由 于 缺少 自 变量 的 约束 ， 


对 于 较 短 时 间 内 的 数据 预测 效果 较 差 ， 可 以 作为 回归 模型 的 替补 方案 使 用 。 


时 间 序 列 的 常用 算法 包括 移动 平均 、 指 数 平滑 、ARIMA 等 。 对 于 观测 值 多 于 50 个 或 具有 平稳 的 时 间 序 列 ， 通 常 使 用 ARIMA 模 型 。 图 2-8 所 示 为 流量 随时 间 变 化 的 趋势 图 。 


流量 随时 间 变 化 的 趣 田 图 
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图 2-8 流量 随时 间 变 化 的 趋势 图 
(5) 分 类 模型 


分 类 模型 属于 数据 预测 的 一 种 数据 分 析 方 法 ， 与 回归 分 析 和 时 间 序 列 的 不 同 点 在 于 ， 分 类 模型 预测 的 是 数据 成 为 某 个 分 组 的 可 能 性 ， 即 回归 分 析 和 时 间 序 列 预 测 的 结果 为 一 个 值 ， 而 分 类 模型 预测 的 结 
果 为 一 个 区 间或 类 别 。 


分 类 模型 的 应 用 通常 可 分 为 两 个 方面 : 一 个 是 根据 目标 结果 寻找 突出 特征 ， 如 根据 已 经 流失 的 客户 名 单 ， 挖 掘 其 流失 特征 进而 有 针对 性 地 采取 措施 以 减少 其 他 客户 流失 ; 另 一 个 是 根据 突出 特征 预测 结 
果 类 别 ， 如 根据 现 有 的 客户 属性 数据 预测 其 对 营销 结果 属于 响应 还 是 非 响应 群体 。 


分 类 模型 的 这 两 个 方面 的 应 用 具有 极 强 的 业务 应 用 价值 和 可 执行 性 : 数据 结果 展示 易于 业务 理解 ， 并 且 从 该 数据 中 可 以 直接 提炼 出 可 供 业务 方 执行 的 关键 要 素 。 图 2-9 所 示 为 在 有 响应 的 客户 中 ， 收 入 和 
RFM 得 分 是 最 主要 的 特征 ， 当 收入 &55654 元 时 ， 用 户 响应 度 为 91.785%， 且 响应 用 户 样本 量 为 11552 个 ; RFM 得 分 是 次 要 的 影响 因素 ， 得 分 和 3.587 分 的 用 户 响应 率 为 100%， 该 响应 用 户 样本 量 为 7750 
个 。 结 合 不 同 影响 因素 下 的 样本 量 及 用 户 响 应 度数 据 ， 即 可 提取 出 目标 用 户 执行 规则 。 假 如 我 们 要 发 送 7500 封 邮件 给 目标 客户 ， 那 么 最 佳 选择 客户 规则 为 : 收入 <55654 元 且 RFM 得 分 和 3.587 分 。 


常用 的 分 类 模型 算法 有 : 决策 树 (包含 C5.0、CART、CHAID) 、 朴 素 贝 叶 斯 模型 等 。 决 策 树 算 法 适合 中 小 数据 量 的 数据 挖掘 ， 可 以 减少 噪声 数据 对 结果 的 影响 ， 但 当 数 据 量 过 大 时 会 影响 决策 树 的 构 
常用 于 中 文 文本 分 类 ， 该 算法 具有 稳定 的 数据 质量 和 较 小 的 误差 率 ， 但 其 构建 基础 是 假定 数据 间 是 相互 独立 的 ， 在 大 多 数 情况 下 数据 间 会 因 具 有 相关 性 的 特征 而 影响 数据 的 实际 结果 。 
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图 2-9 ”客户 响应 规则 挖 所 
(6) 机 器 学 习 


机 器 学 习 的 目的 是 让 机 器 像 人 一 样 ， 通 过 挖掘 出 外 部 数据 中 的 潜在 规律 和 深入 特征 ， 进 一 步 利 用 现 有 的 数据 规律 挖掘 和 探索 未 知 的 数据 规律 ， 从 而 达到 “理解 ”数据 的 目的 ， 实 现 机 器 自我 数据 推理 、 
归纳 、 演 进 的 过 程 。 


机 器 学 习 包 含 上 述 的 所 有 算法 ， 另 外 还 包括 一 些 特殊 的 算法 ， 如 神经 网 络 、 支 持 向 量 机 、 最 大 期 望 算法 、 变 分 法 等 ， 这 些 都 构成 了 机 器 学 习 的 基础 算法 。 


现 有 的 机 器 学 习 仍 处 于 研究 初期 ， 所 谓 的 智能 系统 只 具备 有 限 的 学 习 能 力 ， 仍 然 不 能 满足 企业 日 常 应 用 的 需求 ， 对 机 器 学 习 的 探索 和 研究 ， 必 将 促使 这 一 领域 的 进一步 发 展 。 在 机 器 学 习 理论 和 应 用 成 
熟 后 ， 数 据 价值 的 实现 都 将 源 于 数据 本 身 ， 不 需要 人 力 参 与 思考 。 


2. 数 据 计算 


数据 计算 按照 计算 结果 输出 的 时 间 性 可 分 为 实时 计算 和 离线 计算 ， 部 分 企业 还 会 在 实时 计算 和 离线 计算 之 间 加 入 临时 计算 。 数 据 计 算 模块 对 于 大 多 数 中 小 企业 来 说 没有 必要 单独 进行 拆 分 ， 原 因 是 在 较 
小 的 数据 体 量 和 应 用 需求 下 ， 完 全 可 以 通过 数据 实时 计算 获得 结果 。 数 据 计 算 模块 只 对 大 中 型 企业 或 具备 海量 数据 处 理 需 求 的 企业 有 人 存在 意义 。 


(1) 实时 计算 


实时 计算 需求 通常 是 基于 实时 性 数据 需求 产生 的 ， 实 时 性 数据 需求 基于 特定 场景 和 规则 ， 受 动态 数据 集 、 时 间 周 期 、 算 法 变化 等 因素 的 综合 影响 。 实 时 计算 要 求 数据 每 次 都 是 实时 收集 、 实 时 计算 、 实 
时 反馈 、 实 时 输出 。 实 时 计算 的 时 间 需 求 通常 都 是 秒 级 甚至 微 秒 级 ，Yahoo 的 S4、Twiter 的 storm 都 属于 这 一 类 。 


实时 计算 的 应 用 更 多 的 是 侧重 于 在 线 服 务 。 实 时 计算 的 常见 应 用 场景 包括 : 站 外 基于 用 户 行为 的 实时 广告 投放 的 RTB 和 DSP 系 统 、 站 内 基于 用 户 行为 的 个 性 化 推荐 系统 、 站 内 广告 竞价 系统 、 网 站 实时 
言 息 推 送 服务 、 公 司 智能 预警 、 站 内 搜索 系统 等 。 


例如 ， 假 设 站 内 推荐 引擎 需要 针对 用 户 实时 浏览 行为 进行 挖掘 ， 并 在 用 户 下 一 次 点 击 后 实时 推荐 出 用 户 可 能 喜欢 的 产品 或 内 容 。 算 法 层 可 能 包括 回归 、 协 同 过滤 、 关 联 、 神 经 网 络 等 ， 数 据 层 需要 综合 
用 户 属性 、 历 史 行为 、 站 内 搜索 行为 、 站 内 购物 行为 ， 以 及 上 一 次 行为 ， 大 型 网 站 数据 运算 量 可 能 达到 上 亿 条 ， 推 荐 结果 要 在 用 户 下 一 个 浏览 的 页 面 中 直接 体现 。 


(2) 离线 计算 


离线 计算 相对 于 实时 计算 ， 区 别 在 于 时 间 窗 口 不 需要 实时 性 ， 同 时 由 于 离线 计算 有 相对 充裕 的 时 间 可 以 对 全 部 数据 进行 运算 挖掘 ， 因 此 其 数据 结果 相对 实时 计算 更 准确 。 离 线 计算 一 般 是 批量 处 理 数据 
的 过 程 ， 比 如 利用 Hadoop 的 Mapreduce 就 属于 离线 计算 类 。 


离线 计算 的 数据 处 理 时 间 通 常 是 分 钟 或 小 时 级 ， 甚 至 可 能 是 天 ; 数据 处 理 量 通 常 在 TB、PB 级 以 上 。 


离线 计算 的 应 用 场景 包括 : 用 户 流失 预警 系统 、 基 于 用 户 购买 的 挽回 系统 、 用 户 特征 和 规则 提取 系统 、 数 据 分 析 系 统 和 产品 报表 、 用 户 画 像 系 统 、 渠 道 和 用 户 价值 系统 等 ， 除 实时 计算 外 的 数据 挖掘 都 
采用 离线 计算 方式 实现 。 

(3) 临时 计算 

临时 计算 是 介 于 实时 计算 和 离线 计算 之 间 的 一 种 计算 方式 ， 它 既 能 保持 数据 的 相对 实时 性 ， 又 能 兼顾 数据 结果 的 准确 性 ， 它 是 针对 实时 计算 和 离线 计算 中 间 层 需求 的 一 种 过 渡 性 解决 方案 。 临 时 计算 的 


处 理 时 间 在 秒 到 分 钟 之 间 ， 数 据 处 理 量 在 GB 到 TB 之 间 。 


2.3.4 ”数据 管理 层 
数据 管理 层 是 介 于 数据 和 应 用 之 间 的 介质 和 桥梁 ， 通 常 上 层 自动 应 用 或 产品 化 所 需 的 数据 会 直接 由 数据 计算 层 调用 。 对 大 多 数 企业 而 言 ， 数 据 管 理 层 的 功能 定位 是 用 户 和 数据 管理 。 
用 户 管理 的 主要 工作 是 用 户 权限 的 变更 、 调 整 ， 以 及 数据 接触 点 的 流程 管理 等 ， 用 户 管 理 是 数据 出 口 的 重要 保障 ， 也 是 数据 安全 的 关键 点 。 


数据 管理 的 主要 工作 是 面向 数据 本 身 的 管理 ， 包 括 数据 质量 管理 、 数 据 生命 周期 管理 、 数 据 技术 流程 管理 、 数 据 标 准 和 规范 管理 、 数 据 监控 管理 等 。 数 据 管理 的 目的 是 保障 高 质量 的 数据 结果 、 协 调 不 
同 数据 应 用 之 间 的 可 共享 性 、 统 一 性 、 规 学 性 和 有 效 性 。 


数据 管理 层 通过 数据 管理 平台 PDMP (Data Manage Platform) 实现 ， 但 现在 大 多 数 的 DMP 产 品 仍 集中 应 用 在 底层 数据 整合 和 抽取 等 工作 中 ， 尚 未 上 升 到 管理 数据 的 层面 。 


2.3.5 ”数据 应 用 层 
数据 应 用 层 是 数据 产生 价值 的 出 口 ， 前 期 所 有 的 数据 动作 都 为 后 期 的 输出 做 准备 。 数 据 应 用 层 可 按 数 据 发 挥 价值 的 能 动 性 的 强 弱 分 为 辅助 决策 应 用 和 数据 驱动 应 用 。 


(1) 辅助 决策 应 用 


辅助 决策 应 用 的 数据 来 源 广 泛 ， 可 能 包含 数据 存储 层 、 数 据 计 算 层 、 数 据 管理 的 原始 数据 、 过 程 数 据 和 结果 数据 。 辅 助 决策 应 用 是 目前 数据 发 挥 价值 的 主流 方式 ， 包 括 报表 支持 、 数 据 挖 掘 模型 封装 、 
业务 分 析 系 统 和 | 临时 分 析 等 。 


" 报表 支持 。 报 表 根 据 数 据 结果 的 延迟 性 分 为 即席 报表 (实时 报表 ) 和 首 通 报表 ， 这 是 最 基础 的 数据 应 用 形式 。 

` 数据 挖 握 模 型 封装 。 业 务 分 析 过 程 中 成 熟 的 数据 挖掘 模型 会 封装 到 固定 系统 内 ， 形 成 单独 的 挖 气 模块， 以 便 节省 业务 建 模 过 程 中 的 复杂 工作 ， 如 库存 预测 模型 、 流 失 预 警 模 型 等 。 
* 业务 分 析 系 统 。 业 务 分 析 系 统 包括 流量 分 析 系 统 、 客 户 分 析 系 统 、 销 售 分 析 系 统 等 ， 业 务 分 析 系 统 是 相对 完善 的 分 析 体 系 ， 相 较 于 报表 支持 具备 更 多 分 析 和 挖 据 类 功能 。 

:临时 分 析 。 临 时 分 析 是 针对 业务 临时 性 需求 进行 响应 的 数据 支持 ， 如 促销 活动 分 析 。 

(2) 数据 驱动 应 用 

目前 数据 驱动 应 用 的 数据 大 多 来 源 于 计算 层 的 实时 计算 和 临时 计算 结果 ， 对 于 时 间 性 要 求 不 强 的 场景 主要 调用 离线 计算 数据 结果 。 


数据 驱动 需要 借助 技术 手段 来 实现 ， 通 常 是 建立 在 数据 事件 触发 或 数据 结果 触发 基础 上 的 自动 化 运行 机 制 。 常 见 的 数据 驱动 项 目 包 括 RTB、 个 性 化 EDM、 站 内 个 性 化 推荐 、 个 性 化 着 陆 页 、 网 站 智能 运 
营 、 基 于 用 户 事 件 或 时 间 的 维系 触发 等 。 


] 


. RITB。 实 时 竞价 ， 针 对 每 个 用 户 的 行为 进行 评估 和 出 价 的 实时 竞价 技术 。 每 次 用 户 浏览 产品 时 ， 根 据 用 户 行为 并 结合 投放 策略 、 用 户 定位 、 出 价 等 综合 计算 得 出 综合 排名 ， 排 名 靠 前 者 出 现 广告 。 同 
时 ， 还 可 以 根据 用 户 每 次 的 点 击 行为 ， 有 针对 性 地 推荐 用 户 可 能 喜欢 的 产品 或 广告 内 容 ， 在 提高 用 户 体 验 的 同时 增加 广告 的 点 击 率 。 


` 个 性 化 EDM。 传 统 EDM 是 针对 所 有 用 户 发 送 相 同 的 邮件 广告 ， 或 者 将 用 户 分 类 后 按 类 别 发 送 相同 的 广告 ; 个 性 化 EDM 只 发 送 用 户 可 能 喜欢 的 内 容 或 产品 ， 能 做 到 千 人 千 面 。 
" 站 内 个 性 化 推荐 。 将 个 性 化 推荐 应 用 到 站 内 ， 实 时 推荐 用 户 可 能 喜欢 的 内 容 或 产品 ， 个 性 化 推荐 也 是 千 人 千 面 。 
个 性 化 着 陆 页 。 个 性 化 着 陆 页 是 用 户 从 站 外 到 达 网 站 后 ， 针 对 站 外 用 户 来 源 和 点 击 信息 ， 结 合用 户 的 历史 记录 ， 有 针对 性 地 推荐 用 户 可 能 喜欢 的 产品 或 内 容 。 


“ 网 站 智能 运营 。 传 统 网 站 运营 是 基于 资源 位 或 模块 操作 ， 而 网 站 智能 运营 是 让 全 站 所 有 的 资源 位 根据 运营 内 容 如 广告 、 产 品 或 活动 等 展示、 点 击 、 转 化 数据 结果 ， 并 结合 用 户 的 其 他 行为 进行 分 
自 


析 ， 自 动 实现 资源 位 的 智能 动作 ， 如 自动 上 下 架 、 智 能 展示 时 间 、 自 动 切 换 等 ， 以 实现 商家 、 平 台 和 用 户 的 三 赢 。 
* 基于 用 户 事件 或 时 间 的 维系 触发 。 网 站 整体 数据 打通 后 ， 在 登录 /注册 过 的 用 户 基 于 某 种 事件 或 时 间 规 则 产生 数据 触发 条 件 后 ， 自 动 通 过 邮件 或 短信 接口 发 送 提示 信息 ， 以 达到 挽回 用 户 、 刺 激 购买 、 


提高 活跃 度 和 忠诚 度 等 目的 。 


2.4 本章 小 结 


本 章 围绕 企业 数据 体系 从 数据 价值 最 大 化 的 定位 、 企 业 数 据 职 能 染 构 与 组 成 、 企 业 数 据 技术 架构 与 组 成 三 个 方面 进 ， 其 中 需要 读者 重点 掌握 的 知识 点 如 下 : 
* 工作 价值 最 大 化 一 定 要 拒绝 鸡肋 ， 工 作 、 适 度 “ 放 权 ” 并 关注 核心 业务 ， 这 三 条 准则 适用 于 任何 一 项 工作 ; 


` 企业 内 部 数据 架构 通常 包括 分 散 型 、 集 中 型 和 复合 型 数据 架构 ， 复 合 型 数据 架构 是 适合 大 多 数 企 业 的 数据 架构 形态 ; 


. 企业 数据 技术 架构 通常 包括 数据 收集 层 、 数 据 存储 层 、 数 据 计 算 层 、 数 据 管理 层 和 数据 应 用 层 
作为 数据 体系 的 规划 者 ， 以 下 准则 适用 于 每 个 企业 : 
. 数据 安全 是 大 多 数 企 业 开 展 数据 工作 的 前 提 条 件 ， 安 全 和 信任 密 不 可 分 ; 
. 没有 一 种 架构 适用 于 所 有 的 企业 ， 适 合 企业 实际 需求 和 发 展 阶段 的 架构 就 是 最 好 的 架构 ; 
. 大 多 数 企 业已 经 不 是 缺少 数据 ， 真 正 缺 少 的 是 如 何 将 数据 由 “ 负 资 产 ” 转 化 为 “ 正 资产 ”， 并 真正 运用 到 企业 实践 中 去 的 能 


“ 数据 架构 和 数据 体系 永远 是 一 个 自 上 而 下 的 推动 体系 。 


第 3 草 ”从 零 开 始 建立 数据 分 析 师 个 人 成 长 体系 
在 实现 机 器 自我 学 习 和 数据 智能 之 前 ， 数 据 分 析 师 是 保障 数据 体系 正常 运转 的 枢 组 。 对 于 任何 一 个 企业 ， 经 验 丰富 、 技 巧 娴熟 的 分 析 师 都 是 企业 的 优秀 资产 。 但 一 切 都 不 是 天 生 的 ， 良 好 的 个 人 规划 是 
保障 数据 分 析 师 迅速 成 长 的 关键 ， 


数据 分 析 师 应 该 具备 哪些 知识 体系 呢 ? 不 同 职能 分 工 的 技能 侧重 点 是 哪些 ”如 何 从 零 开 始 一 步 步 地 成 长 ”有 哪些 建议 可 以 减少 数据 分 析 师 走 弯 路 ”本 章 将 围绕 这 些 问题 ， 谈 谈 如 何 建立 数据 分 析 师 个 人 
成 长 体系 。 


3.1 ”数据 分 析 师 的 完整 知识 结构 


作为 数据 分 析 师 ， 无 论 其 最 初 的 职业 定位 方向 是 技术 还 是 业务 ， 发 展 到 一 定 阶段 后 都 会 承担 数据 管理 的 角色 。 因 此 ， 一 个 具有 较 高 层次 的 数据 分 析 师 需要 具备 完整 的 知识 结构 。 
1. 数 据 采 集 


了 解数 据 采 集 的 意义 在 于 真正 了 解数 据 的 原始 面 狐 ， 包 括 数据 产生 的 时 间 、 和 条件、 格式 、 内 容 、 长 度 、 限 制 条 件 等 。 这 会 帮助 数据 分 析 师 更 有 针对 性 地 控制 数据 生产 和 采集 过 程 ， 避 免 由 于 违反 数据 采 
集 规 则 导致 的 数据 问题 ; 同时 ， 对 数据 采集 逻辑 的 认识 增加 了 数据 分 析 师 对 数据 的 理解 程度 ， 尤 其 是 数据 中 的 异常 变化 。 比 如 : 


* Omniture 中 的 Prop 变 量 长 度 只 有 100 个 字符 ， 在 数据 采集 与 部 署 的 过 程 中 就 不 能 把 含有 大 量 中 文 描述 的 文字 赋值 给 Prop 变 量 〈 超 过 的 字符 会 被 截断 ) 。 


. 在 Webttekk 323 之 前 的 Pixel 版 本 中 ， 单 条 信息 默认 最 多 只 能 发 送 不 超过 2KB 的 数据 。 当 页 面 含有 过 多 变量 或 变量 长 度 超出 限定 的 情况 时 ， 在 保持 数据 收集 的 需求 的 前 提 下 ， 通 常 的 解决 方案 是 采用 多 个 
sendinfo 方 法 分 条 发 送 ; 而 在 Webtrekk 325 之 后 的 Pixel 版 本 中 ， 单 条 信息 默认 最 多 可 以 发 送 7KB 的 数据 量 ， 非 常 方便 地 解决 了 代码 部 署 中 单条 信息 过 载 的 问题 。Webtrekk 基 于 请 求 量 付 费 ， 请 求 量 越 少 ， 费 用 
越 低 。 


当 用 户 在 离线 状态 下 使 用 APP 时 ， 数 据 因 无 法 联网 而 不 能 发 出 ， 导 致 正常 时 间 内 的 数据 统计 分 析 延 迟 。 直 到 该 设备 下 次 联网 时 ， 数 据 才 能 被 发 出 并 归 入 当时 的 时 间 。 这 就 产生 了 不 同时 间 看 相同 历史 
时 间 的 数据 时 会 有 出 入 。 


在 数据 采集 阶段 ， 数 据 分 析 师 需要 更 多 了 解数 据 生 产 和 采集 过 程 中 的 异常 情况 ， 如 此 才能 更 好 地 追 本 溯源 。 另 外 ， 这 也 能 在 很 大 程度 上 避免 “垃圾 数据 进 导致 垃圾 数据 出 ”的 问题 。 
2. 数 据 存储 

无 论 数 据 存 储 于 云端 还 是 本 地 ， 数 据 的 存储 不 只 是 我 们 看 到 的 数据 库 那 么 简单 。 比 如 : 

数据 存储 系统 是 MySQL、Otracle、SQL Server， 还 是 其 他 系统 。 

数据 仓库 结构 及 各 库 表 如 何 关联 ， 星 型 、 雪 花 型 ， 还 是 其 他 。 

' 生产 数据 库 接 收 数据 时 是 否 有 一 定 的 规则 ， 比 如 只 接收 特定 类 型 的 字段 。 


“ 生产 数据 库 面 对 异常 值 如 何 处 理 ， 是 强制 转换 、 留 空 ， 还 是 返回 错误 。 


. 生产 数据 库 及 数据 仓库 系统 如 何 存 储 数据 ， 名 称 、 人 含义、 类型、 长度、 精度 、 是 否 可 为 空 、 是 否 唯一 、 字 符 编 码 ， 以 及 约束 条 件 规 则 是 什么 ? 
. 接触 到 的 数据 是 原始 数据 还 是 ETL 后 的 数据 ，ETL 规 则 是 什么 ? 

数据 仓库 数据 的 更 新 机 制 是 什么 ?” 是 全 量 更 新 还 是 增 量 更 新 ? 

. 不 同 数据 库 和 库 表 之 间 的 同步 规则 是 什么 ? 哪些 因素 会 造成 数据 差异 ? 如 何 处 理 差 异 ? 等 等 。 


在 数据 存储 阶段 ， 数 据 分 析 师 需要 了 解数 据 存储 内 部 的 工作 机 制 和 流程 ， 最 核心 的 因素 是 在 原始 数据 基础 上 经 过 哪些 加 工 处 理 ， 最 后 得 到 了 怎样 的 数据 。 由 于 数据 在 存储 阶段 是 不 断 地 进行 动态 变化 和 
迭代 更 新 的 ， 其 及 时 性 、 完 整 性 、 有 效 性 、 一 致 性 、 准 确 性 很 多 时 候 因 软 硬件 、 内 外 部 环境 问题 无 法 得 到 保证 ， 这 些 都 会 导致 后 期 数据 的 应 用 问题 。 


3. 数 据 提 取 


数据 提取 是 将 数据 取出 的 过 程 。 数 据 提取 的 核心 环节 是 从 哪 取 ? 何 时 取 ? 如 何 取 ? 


. 从 哪 取 ? 数据 来 源 不 同 的 数据 源 得 到 的 数据 结果 未 必 一 致 。 


不 同时 间 取 出 来 的 数据 结果 未 必 一 致 。 


“ 何 时 取 ? 提取 时 间 


不 同 提取 规则 下 的 数据 结果 很 难 一 致 。 


“ 如 何 取 ? 提取 规则 
能 ， 但 即使 是 简单 的 提取 数据 工作 也 有 不 同 的 层次 。 第 一 层 是 从 单 张 数据 库 中 按 条 件 提取 


在 数据 提取 阶段 ， 首 先 要 求 数据 分 析 师 具备 数据 提取 能 力 。 常 用 的 Select From 语 句 是 SQL 查询 和 提取 的 必 备 技 
减少 浪费 个 人 时 间 和 消耗 


数据 的 能 力 ，where 是 基本 的 条 件 语 句 ; 第 二 层 是 掌握 跨 库 表 提 取 数 据 的 能 力 ， 不 同 的 join 有 不 同 的 用 法 ; 第 三 层 是 优化 SQL 语 句 ， 通 过 优化 嵌 套 、 筛 选 的 逻辑 层次 和 遍历 次 数 等 ， 


系统 资源 。 


其 次 要 求 数据 分 析 师 具备 理解 业务 需求 的 能 力 ， 比 如 业务 需要 “销售 额 ”这 个 字段 ， 相 关 字段 至 少 有 产品 销售 额 和 产品 订单 金额 ， 其 中 的 差别 在 于 是 否 含 优惠 券 、 运 费 等 折扣 和 费用 。 订 单 金额 中 包含 


了 应 用 优惠 券 等 因素 ， 计 算 逻 辑 是 在 产品 销售 额 (产品 单价 x 数量 ) 的 基础 上 增加 运费 ， 再 减 去 优惠 券 、 促 销 折扣 后 的 价格 ， 该 价格 是 用 户 应 该 支付 的 金额 。 


4 数据 挖掘 

数据 挖掘 是 面 对 海量 数据 时 进行 数据 价值 提炼 的 关键 ， 以 下 是 算法 选择 的 基本 原则 : 
. 没有 最 好 的 算法 ， 只 有 最 适合 的 算法 ， 算 法 选择 的 原则 是 兼 具 准 确 性 、 可 操作 性 、 可 理解 性 、 可 应 用 性 。 
. 没有 一 种 算法 能 解决 所 有 的 问题 ， 但 精通 一 门 算法 可 以 解决 很 多 问题 。 


* 在 挖 据 算 法 中 最 难 的 是 算法 调 优 ， 同 一 种 算法 在 不 同 场 景 下 的 参数 设 定 相 同 。 实 践 是 获得 调 优 经 验 的 重要 途径 。 


在 数据 挖掘 阶段 ， 数 据 分 析 师 要 掌握 与 数据 挖掘 相关 的 能 力 : 一 是 数据 挖掘 、 统 计 学 、 数 学 基本 原理 和 常识 ; 二 是 熟练 使 用 一 门 数据 挖掘 工具 ，Clementine、SAs 或 R 都 是 可 选项 ， 如 果 是 程序 员 出身 


也 可 以 选择 编程 实现 ;三 是 需要 了 解 常 用 的 数据 挖掘 算法 ， 以 及 每 种 算法 的 应 用 场景 和 优秀 差异 点 。 


5. 数 据 分 析 
相对 于 数据 挖掘 ， 数 据 分 析 更 多 地 偏向 业务 应 用 和 解读 ， 在 经 数据 挖掘 算法 得 出 结论 后 ， 如 何 解释 算法 在 结果 、 可 信和 度 、 显 著 程度 等 方面 对 于 业务 的 实际 意义 ”如 何 将 挖掘 结果 反馈 到 业务 操作 过 程 中 
以 便于 业务 理解 和 实施 是 关键 。 

6. 数 据 展现 


数据 展现 即 数据 可 视 化 的 部 分 ， 也 就 是 数据 分 析 师 如 何 把 数据 观点 展示 给 业务 的 过 程 。 数 据 展现 除 遵 循 各 公司 统一 的 规范 和 原则 外 ， 具 体形 式 还 要 根据 实际 需求 和 场景 而 定 。 在 数据 展现 阶段 ， 数 据 分 


析 是 需要 具备 的 基本 素质 具体 的 要 求 体现 在 如 下 几 个 方面 : 


` 工具 。PPT、Excel、Word 黄 至 邮件 都 是 不 错 的 展现 工具 ， 任 何 一 个 工具 用 好 作用 都 很 强大 。 
形式。 图文并茂 的 基本 原则 更 易于 理解 ， 生 动 、 有 趣 、 互 动 、 讲 故事 都 是 加 分 项 。 

. 原则 。 领 导 层 喜欢 读 图 、 看 趋势 、 要 结论 ; 执行 层 喜 欢 看 数 、 读 文字 、 看 过 程 。 

` 场景 。 大 型 会 议 采 用 PPT 最 合适 ; 汇报 说 明 采 用 Word 最 实用 ; 数据 较 多 时 使 用 Excel 更 方便 。 
. 最 重要 的 一 点 是 数据 展现 永远 辅助 于 数据 内 容 ， 有 价值 的 数据 报告 才 是 关键 。 


7. 数 据 应 用 
数据 应 用 是 数据 具有 落地 价值 的 直接 体现 ， 这 个 过 程 需要 数据 分 析 师 具备 数据 沟通 能 力 、 业 务 推动 能 力 和 项 目 工作 能 


: 数据 沟通 能 力 。 深 入 浅 出 的 数据 报告 、 言 简 意 凡 的 数据 结论 更 利于 业务 理解 和 接受 ， 打 比方 、 举 例子 都 是 非常 实用 的 技巧 。 
业务 推动 能 力 。 在 业务 理解 数据 的 基础 上 ， 推 动 业务 落地 实现 数据 建议 。 从 业务 最 重要 、 最 紧急 、 最 能 产生 效果 的 环节 开始 是 个 好 方法 ， 同 时 要 考虑 到 业务 落地 的 客观 环境 ， 即 好 的 数据 结论 需要 有 具 


备 客观 的 落地 条 件 。 


* 项 目 工作 能 力 。 数 据 项 目 工 作 是 循序 渐进 的 过 程 ， 无 论 是 一 个 数据 分 析 项 目 还 是 数据 产品 项 目 ， 都 需要 数据 分 析 师 具备 计划 、 领 导 、 组 织 、 控 制 的 项 目 工作 能 


3.2 ”对 数据 分 析 师 的 职能 素质 要 求 


在 实际 工作 中 ， 每 个 企业 都 会 对 数据 分 析 师 定岗 定 职 ， 对 不 同 职能 和 岗位 的 分 析 师 要 求 不 同 。 


3.2.1 工作 方向 划分 
数据 分 析 师 按照 工作 方向 可 分 为 技术 型 分 析 师 和 业务 型 分 析 师 。 


1. 技 术 型 分 析 师 


技术 型 分 析 师 的 角色 包括 数据 工程 师 、 挖 掘 工 程 师 、 数 据 科 学 家 、 建 模 工程 师 、 数 据 架 构 师 、ETL 工 程 师 等 ， 这 些 称谓 都 或 多 或 少 代表 了 其 工作 性 质 。 


技术 型 分 析 师 的 岗位 目标 侧重 于 底层 数据 收集 与 存储 、 数 据 整 合 与 清洗 、 数 据 平台 搭建 、 数 据 智能 产品 开发 和 维护 等 工作 。 


技术 型 分 析 师 要 求 其 在 所 从 事 的 领域 具有 相应 的 专业 技术 技能 ， 能 通过 技术 途径 解决 与 数据 相关 的 问题 ; 同时 ， 更 重要 也 更 容易 被 各 企业 忽视 的 是 ， 技 术 型 分 析 师 如 果 与 业务 有 直接 的 对 接 关 系 ， 同 样 


需要 具备 基本 业务 常识 和 理解 能 力 。 技 术 型 分 析 师 能 从 事 的 岗位 有 数据 工程 师 、 挖 握 工 程 师 、 建 模 工程 师 等 
2 业务 型 分 析 师 
业务 型 分 析 师 的 角色 包括 市 场 分 析 师 、 数 据 分 析 师 ， 网 站 分 析 师 也 因 通常 被 认为 是 业务 型 分 析 师 而 被 月 入 业务 体系 中 。 


业务 型 分 析 师 的 岗位 目标 侧重 于 通过 数据 直接 服务 于 业务 方 的 日 党 工作， 如 日 常 业务 数据 输出 、 专 项 业务 问题 研究 、 市 场 研究 输出 等 。 


业务 型 分 析 师 要 求 具 备 服务 对 象 的 基本 常识 ， 同 时 需要 结合 技术 技能 为 业务 提供 数据 支持 服务 ， 因 此 需要 相对 复合 型 的 知识 体系 。 区 别 于 技术 型 分 析 师 对 业务 的 理解 ， 业 务 型 数据 分 析 师 不 仅 要 了 解 业 


务 需求 ， 更 要 具备 将 数据 知识 转化 为 业务 价值 的 能 力 ， 通 过 数据 落地 推动 数据 价值 实现 。 


3.2.2 ”工作 职位 划分 


Ew 


不 同 职位 的 数据 分 析 师 的 职能 及 要 求 不 同 ， 大 多 数 中 小 型 企业 会 将 数据 分 析 师 分 为 高 、 中 、 低 三 个 层次 ， 某 些 大 型 或 特大 型 企业 会 做 更 细 的 层次 划分 ， 比 如 会 设置 不 同 的 分 析 师 级 别 ， 
领队 分 析 师 等 。 这 里 仅 以 低 、 中 、 高 级 三 个 层次 来 说 明 不 同 层次 数据 分 析 师 的 基本 素质 要 求 。 


1. 初 级 分 析 师 

初级 分 析 师 是 数据 人 员 架 构 的 基础 组 成 部 分 ， 承 担 了 数据 工作 中 大 多 数 最 基础 的 工作 ， 通 常 初级 分 析 师 的 人 员 比 例 不 应 超过 20%。 

初级 分 析 师 的 定位 是 数据 整理 、 数 据 统计 和 基本 数据 输出 工作 ， 服 务 的 对 象 包 括 中 、 高 级 分 析 师 和 业务 方 等 ， 对 其 素质 的 要 求 侧重 于 基本 数据 技能 和 业务 常识 。 
“ 数据 工具 要 求 。 基 本 的 Excel 操 作 能 力 和 SQL 取 数 能 力 、 与 工作 相关 工具 的 使 用 技能 ， 顺 利 完成 数据 抽取 和 整理 等 工作 ; 基本 数据 输出 能 力 ， 包 括 PPT、 邮 件 、Word 等 使 用 能 
数据 知识 要 求 。 理 解 日 常数 据 体 系 内 涉及 的 维度 、 指 标 、 模 型 ， 辅 助 中 、 高 级 分 析 师 进行 专项 工作 并 承担 其 中 的 部 分 工作 。 
" 业务 知识 要 求 。 理 解 基 本 业务 知识 ， 能 把 业务 场景 和 业务 需求 分 别 用 数据 转换 和 表达 出 来 。 

2. 中 级 分 析 师 


中 级 分 析 师 是 数据 人 员 架 构 中 的 主干 。 中 级 分 析 师 承担 着 公司 的 专项 数据 分 析 工 作 ， 如 各 业务 节点 的 项 目 类 分 析 、 专 题 报 告 等 。 通 常 中 级 分 析 师 的 人 员 比 例 在 40%~60% 之 间 。 


会 有 首席 分 析 


中 级 分 析 师 的 定位 是 数据 价值 挖掘 、 提 炼 和 数据 沟通 落地 ， 服 务 的 对 象 主要 是 业务 方 ， 除 此 之 外 还 可 能 参与 高 级 分 析 师 的 大 型 项 目 并 独立 承担 其 中 的 某 个 环节 。 因 此 要 求 中 级 分 析 师 对 专项 数据 技能 、 
业务 理解 及 推动 能 力 的 要 求 较 高 。 


* 数据 工具 要 求 。 熟 练 使 用 数据 挖 据 工具 、 网 站 分 析 工 具 。 

" 数据 知识 要 求 。 了解 不 同 站 法 和 模型 的 差异 点 及 最 佳 实践 场景 ， 根 据 工作 需求 应 用 最 佳 的 实践 方案 。 
` 业务 知识 要 求 。 深 度 理 解 业务 知识 ， 具 有 较 强 的 数据 解读 和 应 用 推动 能 

3. 高 级 分 析 师 


高 级 分 析 师 职位 通常 是 数据 职能 架构 中 的 火车 头 ， 承 担 了 企业 数据 方向 的 领导 职能 。 高 级 分 析 师 的 人 员 比 例 在 20%~40% 之 间 。 


高 级 分 析 师 的 定位 是 企业 数据 工作 方向 规则 体系 建设 、 流 程 建设 、 制 度 建设 等 ， 服 务 对 象 通常 是 业务 及 企业 领导 层 。 因 此 要 求 其 除了 要 具备 中 级 分 析 师 的 基本 能 力 外 ， 还 需要 具备 宏观 规划 、 时 间 把 


风险 管理 、 效 果 管理 、 成 本 管理 等 项 目 管理 能 


* 高 级 分 析 师 需要 能 搭建 企业 数据 体系 ， 并 根据 企业 发 展 阶 段 提出 适合 当前 需求 的 数据 职能 和 技术 架构 方案 。 


本 


i 


. 高 级 分 析 师 需要 规划 出 所 负责 领域 内 数据 工作 方向 、 内 容 、 排 期 、 投 入 、 产 出 等 ， 并 根据 实际 工作 进行 投入 与 产 出 分 析 ， 同 时 做 好 数据 风险 管理 。 


台 


.高 级 分 析 师 需要 实时 跟 进 项 目的 进度 ， 监 督 数据 项 目 落地 执行 ， 并 通过 会 议 、 汇 报 、 总 结 、 阶 段 性 目标 、KPI 等 形式 做 好 过 程控 制 和 结果 控制 。 


低 、 中、 高 级 不 同 职位 层次 数据 分 析 师 的 能 力 要 求 ， 如 图 3-1 所 示 。 注 意 ， 图 像 越 向 外 代表 对 其 相应 能 力 的 要 求 越 高 ， 反 之 则 要 求 越 低 。 


不 同 职位 层次 分 析 师 的 能 力 了 要求 
一 一 初级 分 析 师 


求 
一 一 中 级 分 析 师 


效 据 工 
辣 级 分 析 师 


于 


HH! 


项 目 能 力 要 求 | 


图 3-1 不 同 职位 层次 分 析 师 的 能 力 要 求 图 


3.3 ”数据 分 析 师 成 长 的 4 个 阶段 


如 何 从 零 开始 起 步 ， 如 何 踏实 、 有 效 地 迈 出 每 一 步 不 仅 是 刚 入 行 的 新 手 所 需 关 注 的 问题 ， 也 是 一 些 工 作 了 很 长 时 间 的 数据 从 业者 要 关注 的 问题 。 现 以 网 站 分 析 师 的 成 长 为 例 进行 说 明 ， 其 他 职位 类 似 。 
基本 认 知 阶段 通常 是 刚 入 行 的 数据 分 析 师 所 处 的 阶段 。 基 本 认 知 阶段 要 做 的 是 尽快 熟悉 所 要 从 事 工作 的 基本 环境 、 工 具 、 流 程 、 制 度 和 常识 ， 具 体 包括 数据 工具 的 基本 认 知 和 使 用 技巧 、 数 据 概 念 和 基 


1. 基 本 认 知 阶段 
数据 与 业务 对 接 和 沟通 流程 、 基 本 业务 运转 常识 等 。 对 于 网 站 数据 分 析 师 的 具体 要 求 如 下 : 


本 常识 、 
"了解 基本 的 网 站 分 析 和 数据 工具 ， 网 站 分 析 工 具 如 Google Analytics、 百 度 统 计 、Adobe Analytics、Webtrekk 等 ;数据 分 析 工 具 如 Excel、SPSS、Clementine、SAS、R 等 ， 了 解 不 同 工 具 有 哪些 功能 及 差异 


定义 和 规则 ， 比 如 需要 清楚 UV、PV、Visit、IP 的 区 别 以 及 数据 差异 的 影响 因素 。 
编程 语言 规则 和 JavaSctipt 规 则 ， 如 果 还 能 了 解 一 些 Cookie、 缓 存 机 制 、HTTP 信 息 会 更 有 利于 后 期 的 发 展 。 


相关 业务 等 ， 理 顺 各 种 业务 的 具体 含义 、 范 畴 、 流 程 等 ， 并 且 能 把 数据 与 业务 工作 关联 起 来 。 


点 。 
了 解 网 站 分 析 及 数据 分 析 的 基本 概念 
了 解 互 联网 工作 的 基本 机 制 ， 掌 握 基 本 的 HTML 语 言 
务 、 会 员 


了解 所 服务 的 业务 对 象 ， 如 营销 业务 、 网 站 运营 业 
关于 如 何 学 习 或 获得 相关 的 知识 ， 有 以 下 几 种 方法 可 以 参考 : 
、 书 籍 等 快速 入 门 。 


定位 行业 或 企业 内 的 大 师 ， 并 通过 其 博客 、 文 章 、 专 著 
拓展 相关 视野 ， 通 过 与 行业 大 师 相 关联 的 人 肪 关系 掌握 更 多 的 学 习 资 源 ， 如 友情 链接 、 好 友 推 荐 、 朋 友 圈 、 知 识 联盟 等 。 
书籍 是 系统 性 学 习 的 重要 途径 ,但 不 是 唯一 途径 ， 很 多 工具 的 帮助 中 心 不 仅 免费 ,而且 介绍 了 非常 多 关于 工具 技能 和 应 用 场景 的 相关 知识 ， 是 不 可 多 得 的 优秀 学 习 资 源 。 
行业 内 的 知识 门户 可 以 作为 学 习 时 的 重要 参 者 点， 其 中 不 乏 精 彩 案 例 、 知 识 解 析 、 深 入 挖掘 ， 以 及 行业 知识 推荐 等 优秀 板块 。 

需要 在 


第 一 步 是 搭建 实践 所 需 的 网 站 环境 。 如 果 情 况 人 允许 ， 建 议 购买 属于 自己 的 域名 和 服务 器 空间 ， 利 用 开源 系统 搭建 一 套 属于 自己 的 网 站 ， 简 单 而 又 无 顷 过 多 地 投入 资金 ， 如 果 确 实 没有 条 件 ， 至 少 需要 企 


2. 个 人 实践 阶段 
在 经 过 基本 认 知 阶段 之 后 需要 将 掌握 的 基本 理论 、 知 识 、 经 验 付 诸 于 个 人 实践 。 
在 自己 的 计算 机 上 搭建 一 套 测试 环境 。 

二 步 是 部 署 网 站 跟踪 代码 。 将 标准 代码 、 定 制 代码 、 特 殊 作 用 的 代码 统统 实践 一 遍 ， 免 费 的 网 站 分 析 工 具 都 可 以 作为 实践 对 象 ， 以 便 系统 地 了 解 和 比较 不 同 的 系统 部 署 、 实 施 及 报告 效果 的 差异 性 ， 


从 而 加 深 对 工具 、 原 理 、 概 念 的 理解 。 


第 三 步 是 进行 网 站 分 析 。 完 成 系统 部 署 后 ， 所 有 的 报表 及 其 中 的 记录 数 、 字 段 值 、 功 能 点 至 少 要 全 部 使 用 一 遍 ， 遇 到 问题 后 首先 通过 帮助 中 心 自 己 寻 找 答案 ， 其 次 才 是 寻求 别人 的 帮助 。 
第 四 步 是 实践 总 结 与 提高 。 实 践 总 结 是 个 人 提高 的 重要 步骤 ， 通 过 总 结 能 发 现 历史 问题 中 的 规律 ， 并 能 把 问题 及 解决 方案 融会 贯通 进而 得 到 系统 性 的 提升 。 
3. 企 业 实 践 阶段 


企业 实践 是 第 三 阶段 。 建 议 新 手 不 要 一 开始 就 拿 企业 的 工作 环境 进行 实践 ， 原 因 是 在 没有 具备 一 定 能 力 和 经 验 的 条 件 下 ， 实 践 可 能 会 对 企业 的 数据 安全 、 数 据 质 量 造 成 灾难 性 的 后 果 ， 尤 其 是 采用 SAAs 
模式 的 网 站 分 析 工 具 的 数据 是 不 可 逆 的 ， 数 据 一 旦 丢失 将 无 法 找 回 。 


在 企业 实践 阶段 ， 企 业 会 有 大 量 的 业务 类 需求 可 供 实 践 ， 同 时 在 更 高 流量 的 支持 下 ， 个 人 的 实践 经 验 会 得 到 极 大 丰富 。 在 数据 量 小 、 业 务 场 景 简单 的 情况 下 ， 网 站 分 析 师 面临 的 问题 少 ， 个 人 提升 有 
限 ; 但 当面 临海 量 数据 、 实 时 要 求 、 复 杂 流 程 时 ， 个 人 能 力 和 经 验 会 快速 积累 。 比 如 ， 以 下 场景 是 只 有 在 大 数据 量 的 情况 下 才 会 出 现 的 : 


. 在 用 户 登 录 谷 歌 账户 后 ， 通 过 Adwords 推 广 的 关键 字 将 被 设 为 not set; 

. 在 唯一 数据 记录 数 达到 一 定 阀 值 后 ， 更 多 的 流量 会 被 合并 为 “ 低 流量 ”; 

当 每 天 请 求 量 达到 1000 万 时 ， 很 多 工具 数据 延迟 问题 非常 严重 ， 甚 至 会 无 法 处 理 数据 ; 

当 数 据 量 超过 某 个 限制 ， 某 些 工 具 会 存在 抽样 ， 相 同 的 维度 在 不 同 的 报表 下 数据 不 一 致 。 

对 于 企业 中 存在 的 种 种 问题 ， 我 相信 “问题 = 机 会 ”。 

4. 行 业 实践 阶段 

当 个 人 的 能 力 已 经 完全 可 以 自如 地 应 对 企业 实践 中 的 种 种 需求 时 ， 下 一 步 需要 把 视野 拓展 到 行业 领域 ， 具 体 包 括 两 方面 的 内 容 : 一 是 数据 视野 ， 二 是 商业 视野 。 


数据 视野 。 网 站 分 析 只 是 整个 数据 分 析 体 系 的 一 个 分 支 ， 数 据 分 析 仅 是 整个 数据 工作 体系 的 一 个 环节 。 更 高 层次 的 数据 视野 意味 着 数据 分 析 师 不 仅仅 局 限于 分 析 工 作 ， 还 要 熟悉 整个 数据 工作 系统 的 各 
个 环节 。 


商业 视野 。 除 BAT 这 种 超级 公司 外 ， 通 常 每 个 企业 都 有 自己 的 聚焦 领域 ， 这 意味 着 该 企业 的 状态 最 多 只 能 代表 该 行业 的 经 验 。 所 谓 隔 行 如 隔山 ， 不 同行 业 中 的 数据 需求 、 工 作 流 程 、 工 作 机 制 、 工 作 内 
容 大 不 相同 ， 因 此 很 难 将 经 验 完整 地 复制 到 其 他 行业 。 对 于 行业 的 突破 可 能 有 以 下 三 种 选择 : 


进入 超级 公司 如 BAT， 几 乎 在 每 个 互联 网 行业 都 有 投资 ; 
. 换 公 司 是 最 直接 的 方法 ,但 通常 成 本 过 高 风险 较 大 ; 


: 进入 乙方 服务 公司 ， 直 接 服务 于 不 同 的 行业 客户 。 


3.4 ”给 数据 分 析 师 的 5 点 建议 


1. 数 据 是 有 立场 的 ， 立 场 决定 解读 
数据 对 于 业务 来 讲 既 是 KPI 的 衡量 标杆 ， 又 是 业务 的 行动 指南 。 有 立场 的 数据 直接 影响 数据 解读 ， 影 响 着 业务 的 行动 趋势 。 
举例 : 假如 某 次 活动 时 网 站 的 转化 率 是 1.2%， 要 对 此 指标 做 数据 分 析 。 


数据 分 析 的 第 一 步 是 定性 结果 ，1.2% 的 转化 率 是 好 还 是 坏 ? 有 比较 才能 区 分 好 坏 ， 如 何 比较 呢 ? 常 用 的 比较 分 析 方 法 有 环比 、 占 比 、 定 基 比 、 横 向 比 、 纵 向 比 等 ， 每 一 种 对 比方 法 又 可 以 选择 不 同 的 时 
间 进 行 对 比 ， 如 昨日 、 上 周 今 日 、 上 月 今日 等 。 不 同 的 比较 方法 、 不 同时 间 的 对 比 结果 可 能 存在 差异 甚至 是 截然 相反 。 如 何在 符合 统计 学 原理 的 基本 前 提 下 做 结果 定性 呢 ? 


假设 第 一 步 定性 工作 完成 ， 该 活动 转化 率 是 好 的 结果 。 下 一 步 需要 分 析 为 什么 好 ? 到 底 是 谁 的 “功劳 ”? 电 商 网 站 做 大 型 促销 活动 时 存在 一 个 普遍 规律 : 只 要 价格 足够 低 ， 无 论 用 户 体验 多 差 、 网 站 Ul 
多 烂 、 送 货 速 度 多 慢 、 客 服 态度 多 差 ， 这 些 都 不 会 影响 转化 率 。 这 意味 着 ， 无 论 企业 营销 、 网 站 运营 工作 效果 如 何 ， 只 要 能 保证 页 面 正 常 工 作 ， 所 有 节点 的 转化 率 结果 都 会 特别 好 。 此 时 ， 各 个 业务 节点 对 
转化 率 的 影响 各 占 多 少 权重 ? 


假设 数据 分 析 师 排除 万 难 ， 通 过 复杂 的 模型 算法 计算 出 各 个 业务 节点 的 贡献 ， 作 为 数据 分 析 师 ， 如 何 跟 领导 汇报 并 和 解读 各 业务 节点 的 真实 贡献 ， 是 实话 实说 还 是 含糊 其 太 ， 甚 至 是 颠倒 是 非 ? 
2 数据 质量 永远 是 数据 分 析 立 项 后 首先 要 考虑 的 


做 过 大 型 或 专项 分 析 的 分 析 师 都 有 这 样 的 经 历 : 在 经 过 预 处 理 、 模 型 建设 、 算 法 调 优 和 分 析 报 告 之 后 ， 最 后 指出 报告 中 的 “亮点 ”一 一 某 个 数据 节点 效果 特别 好 ， 数 据 分 析 师 可 以 考虑 加 大 对 其 资源 的 
投入 。 但 业务 方 可 能 只 需要 一 句 话 就 能 让 数据 分 析 师 瞬间 “石化 ”甚至 消除 存在 感 一 一 那 是 我 们 和 技术 部 门 所 做 的 测试 数据 。 


导致 上 述 问题 出 现 的 原因 是 数据 分 析 师 在 得 到 数据 后 缺少 一 个 重要 步骤 一 数据 质量 验证 。 什 么 是 数据 质量 验证 ? 
. 理解 数据 来 源 、 数 据 统 计 和 收集 逻辑 ， 以 及 数据 入 库 处 理 罗 辑 ; 


* 理解 数据 在 数据 仓库 中 存放 的 细节 ， 包 括 字 段 类 型 、 小 数 点 位 数 、 取 值 范围 、 规 则 约束 等 ; 


明确 数据 的 取 数 逻辑 ， 尤 其 是 在 过 程 中 是 否 对 数据 有 转换 或 重新 定义 ; 

* 第 一 时 间 对 数据 做 数据 审查 ， 包 括 数据 有 效 性 验证 、 取 值 范围 、 空 值 和 异常 值 验证 ， 确 定 其 是 否 与 原始 数据 原则 一 致 等 。 

完成 这 些 工 作 之 后 才 是 数据 分 析 。 但 可 惜 的 是 大 多 数 数 据 分 析 师 都 不 关注 数据 质量 问题 ， 甚 至 对 数据 的 理解 仅 限于 看 到 数据 的 字面 意义 。 

3. 缺 乏 落 地 的 数据 是 没有 价值 的 

无 论 数据 分 析 的 服务 对 象 是 具有 决策 权 的 领导 层 还 是 执行 权 的 业务 层 ， 数 据 的 价值 永远 都 存在 于 辅助 决策 甚至 是 数据 驱动 中 。 但 部 分 数据 分 析 师 的 数据 报告 却 让 业务 方 觉得 没有 价值 : 
* 分 析 过 程 明显 不 符合 业务 操作 的 实际 情况 ; 

结论 明显 是 错 的 ; 


: 建议 方向 性 很 对 ， 但 其 实 是 人 人 都 知道 的 大 道理 ， 具 体 执行 缺乏 落地 点 ; 


“ 建议 方向 性 很 明确 ， 也 有 具体 的 执行 建议 ， 但 是 业务 不 能 执行 。 


在 以 上 问题 中 ， 前 两 条 问题 的 原因 是 数据 分 析 的 基本 数据 能 力 和 业务 基本 常识 不 足 ， 这 是 一 定 要 避免 的 问题 ;而 后 两 条 问题 更 多 是 因 信息 不 对 称 而 引起 的 。 从 数据 分 析 师 的 主观 问题 分 析 ， 根 源 可 能 有 
以 下 几 方 面 的 内 容 : 


数据 分 析 师 不 懂 业 务 操作 流程 ， 赁 自己 的 理解 去 猜测 业务 流程 ; 


" 数据 分 析 师 不 了 解 目前 业务 的 困难 点 和 紧迫 点 ， 想 要 驱动 的 是 业务 的 “次 要 ”关注 点 ; 


` 数据 分 析 师 不 了 解 业务 的 实际 能 力 与 权限 ， 尤 其 是 公司 大 环境 下 的 实施 制约 因素 。 
4 业务 应 用 能 力 和 工具 应 用 能 力 都 重要 ， 不 要 迷信 算法 和 模型 


受制 于 教科 书 的 普遍 理论 ， 以 及 企业 对 技术 类 岗位 的 普遍 重视 ， 很 多 数据 分 析 师 会 过 度 关 注 算法 和 模型 在 数据 分 析 过 程 中 的 作用 。 但 其 实在 面向 业务 类 的 实际 工作 中 ， 业 务 要 的 不 是 多 少 种 算法 或 模 
型 ， 而 是 要 面 对 业 务 问题 的 解决 方案 。 


~ 


举例 : 假如 我 们 通过 天 联 模型 分 析出 不 同 商品 间 的 交叉 购买 数据 ， 分 析 师 该 如 何 解释 结果 ? 


如 果 分 析 师 这 样 解 释 : A 商 品 和 B 商 品 关 联 程度 较 高 ， 从 支持 度 、 置 信 度 和 提升 度 来 讲 效果 显著 。 由 于 对 业务 不 理解 也 不 愿意 过 多 地 理解 复杂 的 算法 、 模 型 和 指标 的 意义 ， 因 此 可 以 预想 到 这 个 数据 挖掘 
的 结果 很 难 落 地 ， 数 据 结果 意义 很 小 。 


如 果 分 析 师 这 样 解释 : A 商 品 和 B 商 品 关联 程度 较 高 ， 意 味 着 用 户 通 常会 一 起 购买 这 两 件 商品 。 基 于 用 户 这 种 行为 是 否 可 以 考虑 这 样 应 用 ， 把 这 两 件 商品 打包 促销 ， 当 用 户 把 A 商 品 加 入 购物 车 时 推荐 B 商 
品 ? 在 进行 活动 页 面 设计 时 是 否 可 以 将 A/B 品 类 、 品 牌 做 临近 设计 以 激发 用 户 关联 购买 的 欲望 ”这 才 是 业务 想 要 的 数据 价值 ， 无 法 与 业务 结合 的 数据 模型 只 是 一 堆 数字 而 已 。 


5. 业 务 需求 是 数据 分 析 的 起 点 ， 但 之 前 需要 培养 业务 的 数据 意识 


业务 需求 是 数据 分 析 的 起 点 ， 很 多 时 候 数据 分 析 师 在 “等 ”业务 方 提出 需求 ， 然 后 通过 数据 支撑 业务 方 更 好 地 开展 工作 。 但 实际 情况 却 是 业务 方 不 需要 数据 ， 这 种 现象 既 可 能 是 传统 习惯 造成 的 ， 也 可 
公司 文化 影响 的 ， 甚 至 可 能 是 个 人 因素 导致 的 : 


“ 没有 数据 决策 的 意识 。 无 论 承认 与 否 ， 大 多 数 业 务 的 第 一 行动 引导 因素 还 是 业务 经 验 ， 无论 是 基于 事实 的 经 验 还 是 拍 脑袋 进行 决策 ， 数 据 不 是 行动 前 必须 参考 的 因素 ， 这 是 习惯 使 然 。 


: 不 知道 数据 有 什么 用 途 。 大 多 数 传统 业务 尤其 是 线 下 企业 ， 不 了 解数 据 能 带 来 哪些 价值 ; 甚至 很 多 时 候 对 数据 的 认 知 缺乏 明确 的 引导 和 告知 ， 甚 至 很 多 时 候 数据 的 价值 会 被 业务 方 认为 是 证 明 或 验证 


自身 设想 正确 与 否 的 途径 。 
: 不 相信 数据 。 当 面临 数据 结果 与 业务 经 验 相 冲突 时 ， 业 务 方 的 第 一 反应 很 可 能 是 怀疑 数据 的 正确 性 ， 他 们 更 愿意 相信 自己 的 经 验 而 非 数 据 结论 。 


数据 分 析 师 不 能 要 求 业 务 方 必须 懂 数 据 、 理 解数 据 ， 但 是 需要 告诉 业务 方 数据 能 解决 什么 问题 、 带 来 哪些 改进 与 提升 ， 如 何 帮助 他 们 解决 实际 问题 等 数据 价值 告知 业务 ， 如 何 能 用 数据 证 明 其 提升 价值 
会 更 有 说 服 力 。 这 样 业务 方才 会 相信 数据 的 有 效 性 、 真 实 性 、 准 确 性 。 在 业务 方 还 没有 具备 数据 意识 之 前 ， 如 何 培养 其 数据 意识 呢 ? 


. 持续 沟通 。 每 周至 少 1 次 、 每 次 至 少 半 个 小 时 的 专项 沟通 ， 一 段 时间 之 后 业务 方 会 形成 一 定 的 数据 潜意识 ， 在 某 些 时 候 会 想到 数据 可 能 会 帮助 他 们 解决 一 些 问题 。 
- 价值 导向 。 在 与 业务 方 沟通 的 过 程 中 ， 强 调和 关注 的 重点 不 是 数据 本 身 ， 而 是 数据 能 给 业务 方 带 来 哪些 实际 利益 、 实 现 哪些 突破 ， 尤 其 是 帮助 业务 方 解 决 最 核心 的 关注 点 。 


* 关注 整体 。 数 据 不 仅 能 在 业务 动作 后 进行 效果 评估 ， 还 能 在 业务 执行 前 进行 业务 预测 与 计划 、 在 业务 执行 过 程 中 进行 及 时 预警 与 数据 监控 ， 数 据 发 挥 作用 的 场景 是 完整 的 ， 防 微 杜 渐 比 亡羊补牢 更 有 


3.5 “本章 小 结 


本 章 围绕 建立 数据 分 析 师 个 人 成 长 体系 的 话题 展开 ， 分 别 从 知识 结构 、 职 能 素质 和 成 长 阶段 三 个 方面 进行 介绍 ， 并 提出 了 5 点 建议 以 帮助 数据 分 析 师 少 走 弯 路 。 
数据 分 析 师 的 完整 知识 结构 包括 数据 采集 、 数 据 存 储 、 数 据 提 取 、 数 据 挖 据 、 数 据 分 析 、 数 据 展现 和 数据 应 用 知识 。 


“ 数据 分 析 师 的 职能 素质 按照 工作 方向 和 工作 职位 分 别 有 不 同 的 要 求 。 


“ 数据 分 析 师 的 成 长 通常 会 经 历 基本 认 知 、 个 人 实践 、 企 业 实 践 和 行业 实践 四 个 阶段 。 
通过 阅读 本 章 ， 和 希望 读者 能 进一步 做 好 以 下 工作 : 

:规划 个 人 的 知识 体系 ， 发 现 个 人 的 能 力 短 板 并 制定 提高 策略 ; 

: 规划 个 人 的 成 长 体系 ， 明 确 个 人 的 发 展 方向 并 通过 实践 提高 每 个 阶段 的 能 力 。 


本 章 中 关于 数据 分 析 师 的 能 力 体系 ， 并 不 是 要 求 每 个 人 都 完全 具有 ， 实 际 上 没有 一 个 人 能 够 完全 精通 所 有 的 数据 环节 。 本 章 希 望 读 者 结合 自身 的 特点 ， 在 掌握 其 中 至 少 一 个 环节 知识 的 基础 上 成 为 具有 
广泛 知识 跨度 或 更 深度 知识 精度 的 角色 个 体 。 


基础 篇 
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“ 第 8 章 ”数据 分 析 场 景 和 方法 


第 4 草 ”网 站 数据 采集 和 配置 


前 面 已 经 介绍 过 ， 网 站 数据 分 析 是 数据 分 析 的 一 个 分 支 ， 但 它 所 涉及 的 知识 不 局 限于 “分 析 ”， 网 站 数据 采集 、 功 能 配置 、 系 统 实施 和 基本 运营 都 是 网 站 数据 分 析 师 的 工作 ， 一 个 高 水 平 的 网 站 数据 分 
析 师 必须 具备 整体 网 站 数据 工作 的 能 力 。 


网 站 数据 采集 以 及 系统 数据 的 处 理 配 置 是 网 站 数据 分 析 的 第 一 步 ， 本 章 介绍 网 站 分 析 系 统 的 完整 数据 工作 流程 和 机 制 ; 同时 以 目前 主流 的 页 面 标记 法 为 例 ， 介 绍 网 站 数据 采集 所 需 的 代码 部 署 实施 以 及 
常见 的 网 站 分 析 系 统 的 数据 配置 模块 。 


4.1 网 站 分 析 系 统 的 数据 工作 机 制 


完整 的 网 站 数据 工作 机 制 包 括 数据 采集 、 数 据 处 理 和 数据 报告 三 个 部 分 ， 如 图 4-1 所 示 : 在 网 站 数据 采集 层 ， 在 线 数据 和 外 部 接 入 数据 得 到 采集 ; 在 数据 处 理 层 ， 在 线 数据 在 采集 规则 的 约束 下 将 完成 原 
始 数据 采集 ， 同 时 根据 处 理 规则 整合 外 部 接 入 数据 并 进行 数据 计算 ， 最 终 成 为 可 供 外 部 调用 的 数据 仓库 中 的 数据 ;在 数据 报告 层 ， 外 部 特定 数据 请 求 得 到 处 理 形 成 最 终 报 告 、 数 据 源 等 。 


4.1.1 数据 采集 


网 站 数据 采集 层 分 为 两 
拓展 。 


用 
四 
各 
Ee 


通过 特定 页 面 或 Activity 标 记 实 现在 线 数据 采集 ， 在 线 数 据 是 网 站 数据 的 核心 组 成 ， 第 二 层 是 通过 外 部 系统 或 手动 形式 导入 的 外 部 数据 源 ， 外 部 数据 源 是 在 线 数 据 的 
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图 4-1 网 站 分 析 系 统 的 数据 工作 机 制 
1. 在 线 数据 采集 


在 线 数 据 采 集 根据 平台 可 分 为 Web 站 、WAP 站 和 APP 站 。Web 站 及 以 HTML 5 开发 的 WAP 站 都 支持 JS 脚 本 采集 ; 较 早 开发 的 不 支持 JS 的 WAP 站 则 采用 NoScript， 即 一 个 像素 的 硬 图 片 实现 数据 跟踪 ; 
SDK 是 针对 APP 进 行 数据 采集 的 特定 方法 和 框架 。 这 三 种 方法 可 以 实现 目前 所 有 线 上 数据 采集 的 需求 。 数 据 采 集 阶段 的 工作 流程 ， 如 图 4-2 所 示 。 


1) 当 点 击 网 站 /APP 时 ， 用 户 客户 端 向 网 站 服务 器 端 发 送 请 求 ， 如 @@ 所 示 ; 
2) 网 站 服务 器 返回 请 求 结果 ， 如 @ 所 示 ， 


3) 用 户 客户 端 开 始 加 载 页 面 ， 同 时 触发 特定 标记 ， 特 定 标记 将 采集 到 的 数据 发 送 到 网 站 分 析 系 统 的 采集 服务 器 进行 处 理 ， 如 人 @@ 所 示 。 


用 户 禾 户 谢 采集 服务 中 


图 4-2 在线 数据 采集 流程 


这 种 客户 端 -服务 器 的 数据 采集 方法 适用 于 大 多 数 的 数据 采集 需求 ， 但 在 这 种 采集 方法 的 前 期 页 面 标记 需要 在 用 户 客户 端 触发 才能 实现 ， 如 果 数 据 不 是 通过 用 户 客户 端 触发 或 触发 时 的 数据 ， 在 网 站 外 部 
则 无 法 收集 。 


比如 ， 在 用 户 使 用 在 线 支 付 的 过 程 中 ， 除 了 企业 要 拥有 结算 工具 意外 ， 大 多 数 网 站 都 需要 切换 到 特定 网 站 如 支付 宝 、 网 银 等 完成 支付 ， 而 支付 过 程 由 于 存在 于 外 部 网 站 ， 无 法 通过 页 面 标记 形式 收集 支 
付 成 功 的 数据 ， 此 时 这 种 客户 端 -服务 器 端的 采集 方法 失效 。 


另外 ， 由 于 数据 经 历 了 从 网 站 服务 器 一 用 户 客户 端 一 采集 服务 器 三 个 节点 ， 从 网 站 服务 器 到 用 户 客户 端的 过 程 可 能 会 有 数据 丢失 的 情况 ， 尤 其 在 订单 结算 等 核心 信息 中 ， 这 种 客户 端 -服务 器 的 采集 方法 
可 靠 性 较 小 。 注 意 : 不 管 采 用 何 种 采集 方法 ， 任 何 网 站 分 析 系 统 的 数据 都 不 可 能 与 企业 内 部 数据 系统 中 的 数据 完全 一 致 ， 数 据 不 一 致 性 存在 于 任何 网 站 的 分 析 系 统 中 ， 对 网 站 分 析 系 统 中 数据 准确 性 的 要 求 
是 数据 误差 与 企业 数据 系统 误差 率 较 小 (通常 在 ?5% 以 下 ) 且 数 据 误 差 率 稳定 。 


针对 上 述 情况 ， 某 些 网 站 分 析 系 统 如 Webtrekk 支 持 Server to Server (S-S， 网 站 服务 器 对 采集 服务 器 ) 的 方法 进行 在 线 数 据 采 集 ， 这 样 就 避免 了 数据 在 客户 端的 中 转 流失 ， 如 图 4-2 所 示 。S-S 的 数据 


采集 过 程 如 下 : 
1) 当 点 击 网 站 /APP 时 ， 用 户 客户 端 向 网 站 服务 器 端 发 送 请 求 ， 如 @@ 所 示 ; 
2) 网 站 服务 器 将 处 理 完 的 请 求 直接 发 送 到 采集 服务 器 ， 如 人 @@ 所 示 。 


所 有 在 线 数据 采集 都 会 受到 采集 规则 的 制约 ， 比 如 排除 特定 IP 地 址 的 流量 、 只 采集 某 个 域名 下 的 数据 等 。 数 据 采 集 规 则 是 数据 采集 的 重要 控制 节点 ， 如 果 出 现 某 些 排除 、 隐 藏 或 直接 忽视 数据 的 采集 规 
则 ， 将 可 能 导致 数据 丢失 。 


ia 所 有 SAAS 网 站 分 析 系 统 都 不 能 处 理 历 史 数 据 ， 这 意味 着 如 果 在 数据 采集 阶段 出 现 数 据 丢 失 将 会 产生 无 法 挽回 的 后 果 ， 建 议 原始 数据 采集 阶段 不 设 定 任何 排除 规则 ; 如 果 数 据 中 可 能 含有 大 量 


的 内 部 测试 数据 ， 测 试 环境 与 生产 环境 应 分 账号 采集 。 
2. 外 部 接 入 数据 


外 部 接 入 数据 根据 接 入 方式 的 不 同 可 分 为 API 接 入 、Excel 接 入 和 Log 接 入 。APl 是 主流 的 大 批量 数据 集成 方法 ， 常 见 的 数据 源 系 统 包括 Baidu 和 Google 的 SEM 数 据 、EDM 数 据 等 营销 类 数据 ， 以 及 企业 
CRM 数 据 等 用 户 类 数据 、 企 业 订 单 及 销售 数据 等 。Excel 是 临时 性 、 小 数据 量 的 导入 方式 ， 人 工 通 过 前 端 界面 上 传 实现 ; Log 是 原始 服务 器 日 志 ， 部 分 网 站 分 析 系统 如 Webtrends 支 持 混合 页 面 标记 数据 和 日 
志 数 据 ， 共 同 作为 网 站 分 析 系 统 的 数据 源 ， 支 持 Log 的 网 站 分 析 系 统 主要 采用 Local， 即 本 地 服务 器 形式 ， 数 据 直 接 在 企业 内 部 交换 。 


外 部 数据 接 入 与 在 线 数据 采集 是 寞 步 进行 的 。 外 部 接 入 数据 进入 网 站 分 析 系 统 后 ， 根 据 数据 处 理 层 的 处 理 规则 ， 在 经 过 数据 抽取 、 加 载 、 转 换 之 后 ， 与 在 线 采 集 数 据 整合 形成 完整 的 数据 源 。 外 部 接 入 
数据 必须 具备 一 定 的 特征 才能 与 在 线 采 集 数 据 整 合 ， 常 见 的 特征 是 以 某 个 字段 作为 天 联 主键 ， 比 如 产品 ID、 渠 道 ID、 用 户 ID、 页 面 1D 或 订单 ID 等 ， 也 可 以 通过 时 间 性 的 特征 进行 数据 整合 处 理 ， 如 按时 间 导 
入 费用 、 站 外 投放 数据 等 。 


外 部 接 入 数据 的 工作 流程 如 图 4-3 所 示 ， 原 始 的 外 部 数据 (文档 、 服 务 器 日 志 、 在 线 其 他 系统 数据 、 离 线 数据 ) 通过 自动 或 人 工整 理 形 成 符合 特定 规范 的 数据 文件 或 带 制 表 符 分 隔 的 数据 文档 ， 然 后 根据 
接 入 机 制 的 不 同 完成 数据 的 整合 工作 。 


. 文档 类 数据 文件 通常 是 通过 前 端 界 面 手 动 上 传 实 现 数据 导入 的 ; 
: 在 线 其 他 系统 数据 以 及 离线 数据 通过 API 进 入 网 站 分 析 系 统 ; 


“ 服务 器 日 志 、 在 线 其 他 系统 数据 以 及 离线 数据 也 可 以 通过 特定 的 FIP 服 务 器 上 传 数据 。 具 体 流 程 为 : 企业 内 部 通过 程序 生成 特定 的 数据 文档 ， 并 按照 一 定时 间 性 的 特征 自动 上 传 到 网 站 分 析 系 统 指 定 


的 FIP 服 务 器 ， 网 站 分 析 系 统 从 FIP 服务 器 采集 数据 ， 通 过 验证 后 处 理 数据 。 


ia 在 理想 情况 下 ， 通 过 API 接 口 导 入 外 部 数据 是 最 佳 选择 ， 但 综合 IT 人 力 、 物 力 和 时 间 投 入 等 因素 考虑 ， 通 过 FTP 导入 数据 的 方式 更 易于 实现 。 前 期 可 以 考虑 使 用 FTP 自动 上 传 的 机 制 ， 待 数据 需 
求 稳定 且 业 务实 现 思路 无 误 后 再 通过 技术 手段 开发 API。 


数据 收集 数据 处 理 


甫 并 界面 


服 芳 厅 - 一 一 
日 志 符合 特定 规范 
的 文档 或 种 
制 表 符 分 隔 


的 数据 文件 


网 站 分 析 系统 
服务 器 


数据 队列 


在 线 其 他 
系统 数据 


FTP 服 务 侣 


图 4-3 ”外 部 接 入 数据 的 工作 流程 


4.1.2 ”数据 处 理 


在 数据 处 理 层 ， 原 始 在 线 采集 数据 和 外 部 数据 在 数据 处 理 及 整合 前 ， 无 法 提供 支撑 后 期 请 求 的 数据 。 在 数据 采集 规则 、 数 据 处 理 规 则 的 约束 下 ， 数 据 经 过 处 理 后 才能 形成 满足 数据 请 求 的 数据 仓库 。 
1 数据 规则 层 

不 同 网 站 分 析 系 统 的 数据 处 理 规则 有 所 差异 ， 网 站 分 析 系 统 的 功能 越 强 大 ， 其 处 理 规 则 越 复杂 。 数 据 规则 按照 数据 处 理 过 程 可 分 为 代码 部 署 规 则 、 数 据 采 集 规 则 和 数据 处 理 规则 三 层 。 

1) 代码 部 署 规则 。 代 码 部 署 规则 是 在 数据 采集 阶段 的 语法 规则 ， 不 同 数据 字段 通过 不 同 的 语法 实现 。 常 见 的 收集 规则 包括 用 户 类 、 事 件 类 、 页 面 浏览 类 、 交 互 类 、 电 子 商务 类 等 。 


2) 数据 采集 规则 。 数 据 采集 规则 是 在 数据 发 送 到 服务 器 端 时 设置 的 只 收集 符合 特定 条 件 的 数据 ， 而 对 其 他 数据 全 部 “忽略 ”， 常 见 的 数据 采集 规则 是 包含 和 排除 ， 如 只 包含 符合 条 件 的 数据 ， 排 除 符合 
条 件 的 数据 。 规 则 内 容 则 有 以 下 几 种 形式 。 


. 特定 网 站 内 容 的 流量 : 如 主机 名 、 目 录 、 请 求 URL、 网 页 标题 、 着 陆 页 地 址 信息 。 
特定 外 部 来 源 的 流量 : 如 推荐 链接 、 社 会 化 媒体 来 源 、 自 定义 来 源 跟 踪 标 记 〈 来 源 、 媒 介 、 位 置 、 广 告 活 动 、 内 容 、 关 键 字 等 ) 。 


* 特定 用 户 属性 的 流量 : 如 浏览 器 、 操 作 系 统 、 设 备 信息 、 网 络 服务 信息 、 操 作 设备 (PC、WAP、APP 应 用 ) 、 国 家 、 城 市 、 地 区 、IP 地 址 等 。 


* 特定 用 户 行为 的 流量 : 如 搜索 、 购 买 、 特 殊 事件 标记 、 自 定义 用 户 维 度 等 。 


3) 数据 处 理 规 则 。 数 据 处 理 规则 是 指 对 原始 采集 数据 进行 处 理 的 规则 要 求 ， 除 满足 日 常 系统 功能 的 需求 而 设 定 的 处 理 逻 辑 以 外 ， 还 有 部 分 通过 人 工 或 API 设 定 的 特殊 处 理 规则 ， 这 些 规则 综合 影响 最 终 
的 数据 仓库 数据 。 常 见 的 数据 处 理 规则 可 以 包含 上 述 所 有 的 数据 采集 规则 的 内 容 ， 除 此 以 外 还 包括 某 些 特定 的 用 法 ， 如 数据 提取 、 复 制 、 转 换 、 组 合 等 ， 详 见 4.3.2 小 节 内 容 的 介绍 。 


2. 数 据 处 理 层 
数据 处 理 层 的 处 理 对 象 分 为 两 种 : 一 是 通用 信息 处 理 ; 二 是 特殊 数据 处 理 。 


1) 通用 信息 处 理 。 尽 管 不 同 网 站 分 析 系 统 功能 有 所 差异 ， 但 有 些 功能 是 所 有 网 站 分 析 系 统 都 具备 的 ， 这 些 信息 在 数据 报告 中 可 能 涉及 的 分 析 维 度 包括 : 全 部 来 源 渠 道 、 引 荐 来 源 、 搜 索引 敬 和 关键 字 、 
全 部 页 面 、 进 入 网 页 、 退 出 网 页 、 访 客 地 域 、 新 老 访 客 、 时 间 等 ; 涉及 的 指标 包括 : UV、 访 问 量 、 浏 览 量 、 停 留 时 间 、1P 数 、 跳 出 数 、 跳 出 率 等 。 这 些 信息 来 源 于 客户 端 发 出 请 求 的 HTTP 通 用 信息 ， 包 
括 : 发 出 请 求 的 IP 地 址 、 时 间 戳 、 请 求 类 型 、 请 求 主干 、 返 回 状态 码 、 返 回 字 节 数 、 客 户 端 信息 等 。 以 下 是 一 段 通用 数据 记录 示例 : 


219.133.0.1 - - [17/Jan/2014: 09: 23: 46 +0800] “GET /adobe-analytics-anomaly-detection.html HTTP/1.1” 200 10935 “http: // www.searchmarketingart.com/webtrekk-a-concern-commerci 


2) 特殊 数据 处 理 。 这 部 分 数据 是 系统 根据 自身 功能 定义 的 数据 规则 信息 ， 该 信息 受 网 站 分 析 系 统 规则 定义 和 页 面 代码 部 署 双重 影响 。 特 殊 数据 包括 的 维度 有 : 电子 商务 跟踪 信息 、 产 品 信息 、 自 定义 汇 
道 信息 、 站 内 搜索 信息 、 用 户 路 径 信息 、 访 问 设备 信息 、 目 标 转化 信息 、 事 件 信息 、 漏 斗 信息 、 关 联 信息 、 用 户 细 分 和 区 段 、 归 因 模 型 信息 、 多 渠道 转化 、 异 常 检测 信息 、 分 组 信息 、 媒 体 跟 踩 信息 、AVB 
测试 信息 以 及 自 定义 维度 信息 等 ， 可 提供 的 指标 包括 : 支持 度 、 频 次 、 首 次 转化 价值 、 辅 助 转化 价值 、 各 级 转化 率 、 到 达 数 、 放 弃 率 、 完 成 率 、 交 互 度 、 访 问 价值 、 价 格 、 数 量 、 实 例 、 位 置 值 、 登 录 注册 
数 、 排 名 、 登 入 率 、CTR、 费 用 、 周 转 率 以 及 自 定 义 指标 等 。 


网 站 数据 仓库 是 支撑 高 级 分 析 需 求 的 数据 基础 ， 因 此 初级 的 网 站 分 析 工 具 由 于 功能 简单 而 无 须 网 站 数据 仓库 ， 所 有 数据 报表 都 是 基于 原始 的 Log 日 志 直 接生 成 。 不 同 网 站 分 析 系 统 中 的 数据 结构 和 定义 
不 同 。 如 Adobe Analytics 的 网 站 数据 仓库 是 一 个 Data Feed 集 ， 拥 有 超过 500 个 字段 的 巨型 库 表 ; Webtrekk 和 Webtrends 的 网 站 数据 仓库 是 一 个 结构 化 、 雪 人 花 型 的 数据 仓库 ， 含 有 24 个 数据 库 共 同 组 成 点 
击 流 数据 仓库 模型 。 关 于 不 同 网 站 分 析 工 具 的 数据 仓库 会 在 后 面 的 内 容 中 具体 介绍 。 


4.1.3 ”数据 报告 


数据 报告 层 是 网 站 数据 输出 的 窗口 ， 常 用 的 请 求 主 体 有 : Web Service、Report API、Excel API、Feed API、DataWarehouse。 


. Web Service: SAAS 模 式 的 网 站 分 析 系 统 都 是 通过 在 线 访问 进入 系统 的 ， 所 有 在 线 访问 产生 的 数据 请 求 都 可 以 归 为 Web Service， 包 括 数据 报告 的 下 载 、 下 钻 、 筛 选 、 展 现 、 上 卷 、 更 新 、 删 除 、 新 增 等 
功能 操作 和 分 析 操 作 。 


. Report API: 部 分 网 站 分 析 系 统 支持 通过 API 调 用 数据 报告 ， 并 集成 到 其 他 系统 。 
. Excel API: 部 分 网 站 分 析 工 具 都 提供 Excel 插 件 ， 通 过 Excel 实 现 数据 查询 、 导 出 等 操作 。 
. Feed API: Data Feed 只 在 高 端 网 站 分 析 工 具 才 提供 ，Data Feed 是 结构 化 的 原始 网 站 数据 的 集合 ， 也 可 以 看 成 是 结构 化 后 的 网 站 行为 日 志 ，Data Feed 常 用 来 与 企业 数据 仓库 (EDW) 进行 数据 整合 。 


DataWarehouse: 部 分 高 端 网 站 分 析 工 具 提 供 数 据 仓库 导出 接口 ， 可 直接 通过 数据 仓库 构成 完整 的 点 击 流 数据 ， 这 种 方式 更 利于 企业 数据 仓库 的 实现 。 


4.2 ”网 站 代码 部 署 


不 同 的 网 站 分 析 系 统 有 不 同 的 代码 规则 和 语法 要 求 。 通 常 所 要 实现 的 功能 越 强 大 ， 代 码 部 署 工 作 就 越 复杂 。 大 多 数 免费 的 网 站 分 析 系 统 由 于 功能 简单 ， 只 需要 部 署 一 段 页 面 通用 脚本 即 可 实现 。 以 下 是 
一 段 百度 统计 的 脚本 ， 只 需 将 代码 部 署 到 所 有 监测 页 面 即 可 。 


<SCTript> 

var hmt = hmt || []; 

(function () { 
var hm = document.createElement (“script”); 
hm.src = “// hm.baidu.com/hm.js69bc5b85f8pbb320597fdqb108378cec92”; 
var s = document .getElementsByTagName (“script”) [0]; 
s.parentNode.insertBefore (hm, s) 

}) () ; 

</script> 


高 端 、 付 费 的 网 站 分 析 系 统 代码 部 署 通常 包括 三 部 分 内 容 : 通用 全 局 脚本 部 署 、 通 用 页 面 脚本 部 署 和 特定 页 面 脚本 部 署 。 
4.2.1 通用 全 局 的 脚本 部 署 


通用 全 局 脚本 是 所 有 网 站 页 面 都 需要 引用 的 脚本 ， 由 于 其 具有 通用 性 ， 因 此 在 大 多 数 情况 下 会 单独 生成 脚本 放 到 特定 的 文件 中 ， 然 后 通过 一 段 页 面 HTML 代 码 来 引用 ， 以 下 是 引用 Webtrekk 的 全 局 JSs 代 
码 : 


<script type=“text/javascript” src=“http: // www.searchmarketingart.com/analytics/webtrekk v3.js”></script> 
通用 全 局 脚本 具有 三 种 功能 : 账户 基本 信息 识别 、 数 据 采集 规则 定义 、 特 定 采 集 功 能 集成 。 
1. 账 户 基本 信息 识别 


账户 基本 信息 包括 系统 分 配 的 账户 ID、Cookie 定 义 、 跟 踩 域 和 网 站 域名 等 。 这 些 信 息 共 同 组 成 账户 的 基本 信息 ， 用 来 标志 要 为 哪个 网 站 采集 数据 、 网 站 唯一 识别 标识 是 什么 、 数 据 采集 到 之 后 发 送 到 
哪 、Cookie 信 息 记 录 存 放 方 式 等 。 以 下 是 一 段 Webtrekk 通 用 Js 中 的 账户 基本 信息 代码 : 


Var webtrekkConfig = { 


trackId : “673163862191775”,， 

Cookie : “1”, 

trackDomain : “tonysongblog01.wt-cn01.net”, 
domain : “www.searchmarketingart.com 、， 


该 信息 根据 不 同 账 户 分 配 的 具体 值 及 自身 的 实际 情况 编写 。 该 代码 也 可 以 写 入 通用 页 面 代码 中 ， 但 考虑 到 便于 后 期 的 维护 管理 并 减少 出 错 率 通常 都 写 入 全 局 调用 Js。 


2. 数 据 采 集 规 则 定义 


数据 采集 规则 定义 是 通用 全 局 脚本 的 核心 ， 代 码 的 功能 包括 定义 数据 采集 和 发 送 的 时 间 、 数 据 有 效 期 、 数 据 履 盖 、 数 据 错 误 判 断 和 异常 值 处 理 、 数 据 运算 逻辑 、 数 据 赋值 规则 和 指定 变量 、 数 据 采集 方 


法 等 。 
这 部 分 代码 是 网 站 数据 正确 采集 的 规则 保障 ， 在 代码 实施 过 程 中 不 能 更 改 ， 否 则 可 能 会 导致 数据 无 法 正常 采集 。 以 下 是 Webtrekk 采 集 代 码 片段 : 


Don toharngeranything Deyend. Ehis:. L1G ON 

Var webtrekkUnloadObjects=[]; var webtrekkLinktrackObjects=[]; var webtrekkHeatmapObjects=[]; var webtrekkV3 = function ($b) {var webtrekkUnload=function ($c, $d) {if ($e.cookie= 
var S$g=$e.ccParams; if (typeof ($g) ==’string\ &&$g! =’\) {p+=$g; }}}; if ($e.wtEp) {if ($e.wtEpEncoded) {p+= 
$e.wtEp; }else{var S$h=$e.wtEp; if (typeof ($h) ==’string‘ &&$h! = 、\) {S$h=$h.split (/; /); 
http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15089/0EBPS/Text/... 


3. 特 定 采集 功能 集成 


特定 采集 功能 在 很 多 网 站 分 析 系 统 中 都 称 为 “Plugins” 即 插件 ， 它 其 实 是 一 段 JS 代 码 ， 但 由 于 这 些 代码 不 是 系统 必 备 的 功能 ， 且 可 能 涉及 费用 问题 ， 因 此 ， 企 业 只 在 需要 时 才 会 部 署 。 


步骤 一 : 将 实现 特定 功能 的 Plugins JS 代码 写 入 通用 全 局 脚本 ; 
步骤 二 : 在 通用 全 局 脚本 中 ， 启 用 Plugins 功 能 ; 
步骤 三 : 在 网 站 分 析 系 统 后 台 ， 指 定 该 变量 的 赋值 字段 ， 即 通过 Plugins 采 集 到 的 数据 放 到 哪个 字段 或 变量 (如 果 已 经 在 Plugins JS 中 指定 变量 则 无 需 重复 定义 ) 。 


现在 以 Webtrekk 系 统 应 用 为 例 : 根据 业务 需求 ， 想 要 收集 用 户 在 每 个 页 面 浏 览 的 数据 情况 ， 即 每 个 页 面 用 户 看 了 全 部 内 容 的 5%、20% 还 是 100%。 该 需求 反映 到 数据 系统 中 ， 可 以 通过 Scrollposition 
插件 实现 ， 具 体 步骤 如 下 。 


聚 一 : 将 Scrollposition 脚 本 写 入 通用 全 局 脚本 ， 代 码 如 下 。 


// Plugins Scrollposition 
function wt scro] [1position (conf) { 
if (conf.mode == “page” && conf.type == “after’” && conf.requestCounter == 1) { 
var instance = this; var event = ( (this.wtTypeof (window.onbeforeunload) ) ? “beforeunload” : “unload”) ; var de = document.documentElement; var scrollPosition = 
} 


en 


步骤 二 : 在 通用 全 局 代码 中 ， 通 过 executePluginFunction 启 用 脚本 功能 。 


Var webtrekkConfig = { 
trackId : “673163862191775”,， 
cookie : “1”, 
trackDomain : “tonysongblog01.wt-cn01.net”, 
domain : “www.searchmarketingart.com; webtrekk.searchmarketingart.com”, 
mediaCode : “wt mc”, 
executePluginFunction : “wt scrollposition 、 


步骤 三 : 在 “Webtrekk 一 自 定义 参数 一 事件 参数 ”模块 中 配置 该 功能 。 由 于 在 脚本 中 已 经 指定 Scrollposition 的 变量 参数 是 540， 因 此 直接 选择 该 参数 ID， 然 后 保存 即 可 ， 如 图 4-4 所 示 。 


加 Ye5 加 No 


Capture Data for Raw Data 
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Amount Parameter Values 


图 4-4 Webtrekk 页 面 浏 览 百分比 设置 


最 后 ， 在 系统 中 可 看 到 页 面 浏览 百分比 的 数据 报告 ， 如 图 4-5 所 示 。 


No. ScrollPosition Qty ScrollPosition™w 


图 4-5 ”Webtrekk 页 面 浏览 百分比 报告 


4.2.2 ”通用 页 面 的 脚本 部 署 
通用 页 面 的 脚本 可 以 在 不 同 页 面 有 针对 性 地 采集 数据 ， 如 不 同 产品 页 面 有 不 同 的 产品 名 称 。 页 面 脚本 具有 比 全 局 脚本 更 灵活 的 控制 规则 ， 针 对 不 同 页 面 按照 内 部 数据 的 需求 收集 相关 数据 。 
通用 页 面 脚本 通常 可 以 实现 不 同 页 面 的 数据 区 分 采集 ， 包 括 : 自 定 义 页 面 名 称 、 设 置 页 面 热 力图 、 产 品 信息 追踪 、 渠 道 信 息 追 踪 、 订 单 信息 追踪 等 。 现 以 Webtrekk 为 例 简要 地 介绍 每 个 功能 。 
1. 自 定义 页 面 名 称 


每 个 页 面 都 有 相应 的 URL 地 址 ， 但 该 地 址 不 便于 业务 理解 和 识别 ， 因 此 需要 指定 具有 特殊 规则 的 值 。 一 种 做 法 是 采集 每 个 页 面 的 Title 作 为 页 面 名 称 ， 另 一 种 更 灵活 的 做 法 是 根据 企业 需求 定制 该 名 称 ， 
如 将 产品 类 别 、 产 品名 称 、 网 站 层次 目录 等 写 入 页 面 名 称 。 以 下 是 一 段 针对 产品 终端 页 的 代码 示例 : 


wt.contentId = "产品 终端 页 | 大 家 电 | 海尔 彩电 " ; // 任意 指定 页 面 名 称 


2. 设 置 页 面 热力 图 


大 多 数 页 面 点 击 热力 图 的 配置 需要 两 步 : 第 一 步 是 部 署 特定 页 面 ， 该 步骤 不 是 必需 的 ， 只 在 有 特定 需求 的 情况 下 进行 部 署 ， 如 只 针对 某 些 页 面 开 启 热力 图 ; 第 二 步 是 查看 时 配置 热力 图 。 在 页 面 中 控制 
热力 图 启用 与 否 的 代码 如 下 : 

<div class=“wrapper” id=“wt refpoint”> // 针对 居中 对 齐 的 网 站 设置 热力 图 参考 点 

wt.heatmap = “1”; // 启用 热力 图 跟踪 ，0 为 不 启用 


产品 信息 跟踪 是 电子 商务 跟踪 的 基本 模块 ， 产 品 相关 跟踪 包括 产品 名 称 、 分 类 、 数 量 、 价 格 、 状 态 等 标准 字段 以 及 通过 自 定义 变量 收集 的 自 定义 字段 。 自 定义 字段 通常 包括 : 产品 促销 (是 否 促销 ) 、 
促销 分 类 (抢购 、 团 购 、 预 售 等 ) 、 产 品 属性 (尺寸 、 颜 色 、 折 扣 等 ) 。 以 下 是 一 个 页 面 中 (通常 是 购物 车 流程 ) 同时 包含 两 种 商品 的 标准 跟踪 代码 : 


wt.product = "pullover; jeans " ; // 产品 名 称 

wt.productCategory = { 

1 : "tops; jeans " ， // 产品 一 级 类 别 ， 可 选 

2 : "noname; levis'" // 产品 二 级 类 别 ， 可 选 

上 

wt.productQuantity = "2; 1"; /lL 六 品 数 量 ， 可 选 

wt.ProquctCost = " 99.90; 69.95 " ; // 产品 总 价格 ， 可 选 

wt.proquctStatus = "conf " ; // 产品 状态 ， 衙 选 二 加 入 购物 车 : 确认 、 浏 览 (agd|conf|view) 
4. 渠 道 信息 跟踪 


渠道 信息 跟踪 是 指 对 站 外 投放 和 合作 推广 的 流量 做 特定 标记 ， 以 便于 衡量 投放 效果 。 渠 道 信息 跟踪 标 记 是 在 URL 中 实现 对 渠道 的 识别 ， 以 下 定义 了 一 个 标记 为 google0103 的 渠道 


http: // www.searchmarketingart.com/wt mc=google0103 


渠道 信息 跟踪 通过 特定 代码 标记 ， 标 记 代 码 可 以 定义 为 任何 参数 ;除了 识别 “渠道 身份 ”外 ， 还 可 以 做 特定 事件 识别 或 分 类 。 
wt.mediaCode = "mc"; 自 定 义 的 跟踪 代码 

wt .mediaCodeCookie = = "sid"; / 用 来 对 广告 在 一 次 visit 中 多 次 进入 进行 排 重 ， 只 计算 第 一 次 

wt.campaignId = " mc%3DNewsletter Bn 08"; // 用 来 对 广告 进行 分 类 

wt.campaignAction = "view"; // 用 来 识别 广告 动作 是 基于 浏览 还 是 帖 记 ， 值 为 view | click 

5. 订 单 信息 跟踪 


订单 信息 跟踪 是 电子 商务 跟踪 的 核心 ， 包 括 订单 iD、 订 单价 值 、 订 单产 品 信 息 、 优 惠 券 信息 等 ， 产 品 信息 可 通过 上 述 “ 产 品 信息 跟踪 ”代码 实现 。 同 时 ， 在 订单 提交 成 功 页 时 ， 也 可 以 加 入 自 定义 参数 
部 


来 丰富 跟踪 数据 ， 如 订单 状态 、 积 分 使 用 、 优 惠 券 信息 、 配 送 方 式 、 支 付 状 态 等 。 以 下 是 标准 跟踪 和 部 分 自 定 义 跟 踪 代 码 : 
wt.orderId = "M-12345 " ; // 订单 ID 
wt.orderValue = "52.99"; // 订单 价格 
wt.couponValue = “10.5”; // 优惠 券 价格 
wt.customEcommerceParameter = { 
1 : “944”, // eb 
2 : "顺丰 快递 ， 中 通 快 递 / 针对 产品 级 别 的 配送 方式 
3 : “未 支付 “， // 入 9 以 


6. 针 对 不 支持 JS 客户 端的 跟踪 


浏览 器 支持 JS 触发 是 网 站 分 析 工 具 收 集 数据 的 基本 前 提 ， 不 支持 Js 的 浏览 器 (用 户 ) 信息 无 法 通过 Js 方式 实现 。 目 前 支持 Js 的 浏览 器 比例 大 概 在 95% 左 右 ， 虽 然 这 个 比例 足以 实现 我 们 对 网 站 用 户 行为 
的 分 析 和 判断 ， 但 某 些 情况 下 我 们 还 是 想 跟 踪 不 支持 JS 或 不 启用 JS 跟 踪 的 用 户 信息 。 针 对 这 部 分 用 户 ， 通 常 采用 1x1 硬 图 片 形 式 跟踪 用 户 ， 其 代码 如 下 : 


<noscript><div><img src="“http: // tonysongblog01.wt-cn01.net/673163862191775/wt? p=325, 0” height="“1” width="“1” alt="“” /></div></noscript> 


7. 自 定义 参数 发 送 顺 序 


所 有 的 网 站 分 析 工 具 的 每 条 请 求 都 是 有 长 度 限制 的 ， 如 Webtrekk 在 3.2.5 版 本 之 前 的 Pixel 最 大 只 支持 2K 数 据 ， 之 后 的 Pixel 最 大 支持 7K 数 据 。 在 页 面 信息 采集 的 过 程 中 由 于 变量 过 多 或 某 个 变量 值 过 长 可 
能 会 导致 数据 长 度 超 过 限制 ， 重 要 数据 可 能 会 被 丢失 。 为 此 ， 系 统 允 许 指定 某 些 重要 参数 优先 发 送 。 在 以 下 代码 中 ， 如 果 存 在 ov、oi、st、co、qn、ba、cd、cs15、cs16、cs17、cs18、cs19、cs20， 则 
优先 友 送 数据 : 


2 
9 


wt.paramFirst = "ov; oi; st; Co; qn; ba; cd; cs15; cs16; cs17; cs18; cs19; cs20; 


8. 页 面 J9 代 码 加 载 的 安全 措施 


Js 代码 可 能 由 于 很 多 原因 会 产生 错误 而 无 法 正确 加 载 ， 这 样 会 直接 导致 Js 代码 之 后 的 其 他 HTML 代 码 无 法 执行 ， 导 致 页 面 信息 展现 时 出 错 甚至 整个 页 面 空 白 的 情况 。 针 对 这 种 情况 ， 可 以 定义 一 个 函数 
来 判断 Js 代码 是 否 出 现 错误 ， 如 果 正 确 ， 则 继续 加 载 Js 代 码 。 


if (typeof (webtrekkV3) == " function" ) { 
var webtrekk = { 

contentId : "",， 

JinkTrack : 二 Link "ys 

linkTrackAttribute : “es 

heatmap : "1",，, 

form : Wn 

formAttribute : "id" 


}; 
Var wt = new webtrekkV3 (webtrekk) ; 
wt.sendinfo () ; 


} 


9. 页 面 JS 代码 延迟 加 载 控制 


毫 无 疑问 ， 很 多 的 JS 代码 会 减缓 页 面 的 加 载 速度 (Js 代码 的 延缓 作用 其 实 是 微 平 其 微 的 ， 相 比 页 面 中 图 片 等 因素 的 延缓 作用 ， 该 延缓 可 以 忽略 不 计 ) ， 大 多 数 技术 处 理 是 把 Js 代码 放 到 页 面 底部 ， 等 其 
他 代码 加 载 完 成 之 后 再 加 载 JS 代码 。 系 统 允 许 使 用 setTimeout 控 制 Js 代码 延迟 加 载 时 间 ， 以 下 代码 为 控制 延迟 3 秒 执行 脚本 。 


function createWebtrekkPixel () { 
if (typeof (webtrekkV3) == " function" ) { 
var webtrekk = { 


COntentIq : y 

linkTrack : " link", 
linkTrackAttribute : "Tos 
heatmap : "1",，, 

form : es 

formAttribute : "i" 


en 

window.wt = new webtrekkV3 (webtrekk) ; 
wt.sendinfo () ; 

} 
} 
window.setTimeout ("createWebtrekkPixel () ", 3000) ; 


人 @@ 汪 未 ”走运 加 载 可 能 会 导致 采集 到 的 数据 缺失 明显 ， 很 多 用 户 可 能 在 代码 加 载 前 3 秒 内 ) 就 已 经 退出 了 页 面 ， 导 至 无 法 跟踪 到 。 
10. 多 账号 跟踪 设置 


很 多 大 公司 由 于 体制 和 权限 划分 的 原因 ， 可 能 需要 在 底层 数据 采集 时 即 进行 分 账号 (区 分 数据 包 或 Profile) 。 此 时 需要 配置 多 账号 跟踪 ， 其 代码 如 下 : 


var wtl = new webtrekkV3 () ; // 生成 的 第 一 个 实例 
wt1.trackId=" 111111111111111"; // 为 第 一 个 实例 指定 TrackID 
wtl.sendinfo () ; // 为 第 一 个 实例 发 送 跟踪 请 求 
var wt2 = new webtrekkV3 () ; // 生成 的 第 二 个 实例 
wt2.trackId=" 222222222222222 " ， // 为 第 二 个 实例 指定 TrackID 
wt2.sendinfo () ; // 为 第 二 个 实例 发 送 跟踪 请 求 


4.2.3 ”特定 页 面 的 脚本 部 署 


特定 页 面 的 脚本 部 署 相对 于 通用 页 面 的 脚本 部 署 ， 更 侧重 于 对 页 面 某 个 元 素 或 对 象 的 跟踪 ， 如 页 面 事 件 、 下 载 、 表 单 等 。 常 用 的 针对 特定 页 面 对 象 的 跟踪 包括 事件 跟踪 、 表 单 跟踪 、 站 内 搜索 行为 跟 
踪 、 下 载 跟 踪 、 登 录 / 注 册 用 户 跟踪 等 。 


1. 事 件 跟踪 


事件 跟踪 包括 对 页 面 所 有 链接 、 非 连接 (Javascript 脚本 、 锁 点 等 ) 的 点 击 次 数 跟踪， 也 可 以 定义 某 个 事件 的 触发 次 数 ， 如 某 个 按钮 的 点 击 次 数 ， 视 频 播 放 或 暂停 的 使 用 次 数 。 事 件 跟 中 是 页 面 动作 的 常 
用 跟踪 方法 ， 以 下 是 针对 页 面 “ 联 系 我 们 ”动作 的 跟踪 代码 : 


<a href=" contact.htm" onclick="wt.sendinfo (1{] inkId: acttionname’ ) ; ">Link to 
contact page</a> // 针对 某 个 链接 启用 事件 跟踪 
2. 表 单 跟踪 


表单 跟踪 是 做 表单 分 析 的 关键 ,表单 可 以 跟踪 到 表单 的 填写 次 数 、 放 弃 次 数 ， 表 单 值 等 ， 结 合 结果 数据 (放弃 率 ) 和 过 程 数据 ( 值 ) 可 以 更 好 的 分 析 表 单 流失 的 原因 ， 该 方法 常用 于 注册 、 登 录 、 购 物 
车 、 试 用 等 表单 分 析 场 景 。 


wL.form = \17; // 启用 表单 跟踪 
wt.formFullContent = “author; email; url; comment”; // 设置 要 跟踪 表单 值 的 字段 
<input type="hidden" name="wt form" value="1"> // 标记 表单 


3. 站 内 搜索 行为 跟踪 


站 内 搜索 行为 跟踪 有 两 种 跟踪 方式 : 如 果 是 以 GET 方 式 进行 响应 的 ， 只 需 在 系统 后 台 配 置 搜 索 参 数 如 s、word、Keyword 等 即 可 ， 无 须 代 码 部 署 ; 如 果 是 以 POST (判断 是 POST 还 是 GET， 最 简单 的 方 
法 是 搜索 后 看 URL 中 是 否 有 搜索 参数 ) 实现 的 ， 则 需要 通过 以 下 代码 实现 : 


wt.internalSearch = "adidas shoes " ; // 站 内 搜索 词 


4. 下 载 跟踪 

下 载 跟 踪 可 以 使 用 事件 跟踪 实现 ， 另 外 也 支持 下 载 行为 的 单独 跟踪 。 其 代码 如 下 : 
wt.linkTrackDownloads = "pdf; doc"; // 指定 要 跟踪 的 下 载 格 式 

5 登录 /注册 用 户 跟踪 


无 论 是 基于 Visit 的 访问 分 析 ， 还 是 基于 Visitor 的 访客 生命 周期 分 析 ， 大 多 数 网 站 分 析 系 统 都 是 基于 匿名 的 用 户 数 据 提供 分 析 视 角 。 用 户 登录 后 ， 除 了 可 以 通过 事件 跟踪 用 户 登录 /注册 的 事件 、 通 过 表单 
跟踪 用 户 表 单 完成 情况 ， 还 可 以 跟踪 用 户 1D， 并 以 用 户 真 实 ID 作 为 唯一 识别 标识 进行 用 户 行为 分 析 。 以 下 代码 记录 了 用 户 登录 /注册 后 的 ID， 该 ID 与 企业 CRM 中 的 用 户 1D 一 致 ， 可 作为 用 户 信息 扩 展 和 外 部 
数据 导入 时 的 主键 使 用 。 


wt.customerId = " 372dla04d003eebc09e17330d5d3117c"; // 用 户 ID 


以 上 功能 基本 可 以 满足 大 多 数 的 网 站 跟踪 需求 ， 但 还 有 些 场 景 是 在 特殊 情况 下 使 用 的 ， 通 过 JSON 实 现代 码 跟 踪 、 排 除 特 定 页 面 的 参数 、 针 对 Flash 和 媒体 的 跟踪 、 数 据 类 别 (将 产品 、 页 面 、 媒 体 、 时 
间 、CRM 进 行 分 类 ) 、 自 定义 参数 (会 话 、 页 面 、 事 件 、 电 子 商务 、 曹 销 活动 、 独 立 参 数 ) 等 ， 这 些 项 目 可 根据 实际 需要 设置 。 


4.3 系统 功能 配置 


系统 功能 配置 阶段 的 主要 工作 是 通过 配置 指定 数据 采集 、 处 理 、 输 出 、 展 现 等 方面 的 规则 ， 通 常 由 网 站 分 析 系统 管理 员 实现 。 系 统 功能 配置 包括 数据 安全 设置 、 数 据 处 理 设置 、 数 据 转化 设置 、 数 据 整 
合 设置 和 数据 智能 工作 设置 。 


4.3.1 ”数据 安全 设置 


数据 安全 设置 的 目的 是 实现 数据 安全 管理 ， 保 证 数据 不 被 泄露 ， 通 过 特定 数据 的 匿名 化 处 理 、 用 户 权限 和 共享 权限 的 设置 来 实现 。 


1. 数 据 匿名 化 处 理 


IP 匿 名 处 理 是 数据 匿名 处 理 的 主要 方法 ， 根 据 匿名 程度 的 不 同 可 分 为 以 下 四 个 层次 。 

" 普通 匿名 化 ， 只 隐藏 IP 最 后 一 个 地 址 段 ， 如 123.123.123.***。 

. 中 等 匿名 化 ， 隐 藏 IP 最 后 两 个 地 址 段 ， 如 123.123.***.***。 

. 增强 匿名 化 ， 隐 藏 IP 最 后 三 个 地 址 段 ， 如 1234* 4kk。 

` IP 完 全 匿名 ,隐藏 所 有 IP 地 址 信息 ， 这 意味 着 用 户 IP 来 源 的 信息 全 部 隐藏 或 删除 。 

全 尘 癌 IP 数 据 匿名 化 处 理 后 ， 部 分 地 域 报表 可 能 无 法 使 用 。 原 因 是 所 有 关于 地 区 、 国 家 、 城 市 等 地 域 报 表 都 是 基于 IP 地 址 匹配 形成 的 ， 没 有 IP 数 据 ， 地 域 报表 无 法 处 理 。 
2. 数 据 用 户 权 限 设置 


数据 用 户 权限 设置 通常 包括 对 用 户 群 组 以 及 用 户 角色 的 控制 。 用 户 群 组 是 将 一 类 用 户 分 为 一 个 群 组 ， 然 后 针对 该 群 组 设置 数据 权限 。 用 户 群 组 管理 是 大 型 网 站 分 析 系 统 中 用 户 有 效 管 理 的 主要 方式 ， 群 
组 分 类 通常 按照 企业 组 织 架构 或 业务 流程 划分 。 


数据 用 户 权限 的 灵活 性 是 网 站 分 析 系 统 强 大 与 否 的 重要 参考 标准 ， 尤 其 对 于 大 型 企业 的 数据 安全 可 能 是 开展 一 切 工作 的 前 提 。 如 果 不 能 让 业务 部 门 接触 数据 分 析 系 统 ， 那 数据 价值 很 难 发 挥 。 数 据 权限 
的 控制 主体 分 为 以 下 几 种 。 


* 维度 和 指标 : 指定 用 户 只 能 使 用 某 些 维度 和 指标 。 
* 用 户 有 效 期 : 指定 用 户 特 定 的 时 间 范 围 或 登录 失效 时 间 。 
* 限定 IP 登 录 : 某 些 公司 只 允许 在 公司 内 登录 ， 可 指定 只 能 在 特定 IP 地 址 段 登 录 系 统 。 


* 功能 架构 : 指定 用 户 只 能 查看 某 些 报表 、 书 签 、 报 告 、 功 能 模块 等 ， 如 报表 菜单 可 见 度 ， 数 据 导 入 /时 出 ， 事 件 、 目 标 、 用 户 、 报 告 、 细 分 、 热 图 、 漏 斗 、 市 场 营销 的 新 建 、 删 除 、 过 滤 、 细 分 ，API 
调用 ，Excel 应 用 等 。 功 能 架构 控制 是 目前 最 主要 的 用 户 权限 设置 形式 。 


* 特定 数据 内 容 : 基于 功能 架构 的 权限 控制 只 能 控制 用 户 是 否 能 查看 报表 ， 但 无 法 在 同一 报表 中 让 不 同 部 门 或 用 户 角色 只 看 特定 的 内 容 ， 比 如 在 进入 来 源 渠 道 报表 中 ，SEM 权 限 只 能 看 SEM 的 数据 ， 新 
媒体 权限 只 能 看 新 媒体 。 


3. 数 据 共 享 权限 设置 


数据 共享 权限 设置 包括 报告 、 书 签 、 细 分 、 目 标 、 权 限 等 在 不 同 用 户 之 间 的 共享 。 数 据 共享 对 于 大 型 企业 的 数据 工作 尤为 重要 ， 数 据 共享 能 在 数据 中 心 的 控制 下 ， 使 用 所 有 部 门 统一 的 数据 应 用 标准 ， 
如 建立 统一 的 用 户 群 体 细 分 标准 、 使 用 相同 的 自 定义 指标 或 标准 报告 等 ; 数据 共享 还 能 减少 不 同 部 门 对 于 相同 或 类 似 工 作 的 重复 劳动 ， 如 各 个 部 门 都 会 在 大 型 活动 之 后 进行 数据 分 析 ， 针 对 这 个 活动 可 以 建 
立 可 共享 的 数据 内 容 ， 以 方便 各 部 门 的 工作 。 


4.3.2 ”数据 处 理 设置 


数据 处 理 设置 包括 数据 跟踪 设置 、 数 据 过 滤 规 则 、 数 据 分 组 规则 、 指 定 变量 规则 、 模 型 计算 规则 等 。 强 大 的 网 站 功能 报表 需要 复杂 的 数据 处 理 逻 辑 支 持 ， 因 此 数据 处 理 规则 是 网 站 分 析 系 统 数据 处 理 的 
核心 ， 也 是 网 站 分 析 系 统 功能 强大 与 否 最 重要 的 评价 标准 。 


1. 数 据 跟踪 设置 


数据 跟踪 设置 在 大 多 数据 网 站 分 析 系 统 中 都 使 用 默认 定义 ， 如 Visit 的 定义 时 间 默 认为 30 分 钟 ， 搜 索引 擎 报表 通过 固定 的 搜索 引擎 列表 实现 。 这 些 底层 的 逻辑 定义 ， 大 多 可 以 通过 代码 部 署 实现 。 如 以 下 
是 Google Analytics 自 定义 搜索 引擎 列表 代码 : 


_agdgdorganic\, ‘baidu‘', “word \]， 
addOorganic‘, ‘soso‘, ‘w'\], 

agddorganic‘, ‘youdao\， ‘q\]， 

_agdgdorganic\, ‘sogou', “query \]， 


[* 
EE 
[4 
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数据 跟踪 设置 除了 直接 部 署 代码 外 ， 还 可 以 通过 系统 后 台 配 置 实现 ， 这 种 实现 方法 具有 很 多 优势 : 一 是 简化 了 实施 代码 ， 减 少 技术 出 错 的 概率 ; 二 是 网 站 分 析 师 可 以 自己 定义 处 理 逻 辑 ， 减 少 了 对 IT 的 
依赖 ， 保 证 数据 规则 及 时 生效 。 常 见 的 数据 跟踪 设置 包括 以 下 6 个 方面 的 内 容 


Visit 有 效 期 : 默认 Visit 有 效 期 为 30 分 钟 ， 该 时 间 可 以 自 定 义 。 所 有 网 站 分 析 系 统 都 采用 此 规则 ， 修 改 后 会 影响 全 站 所 有 分 析 维 度 的 数据 。 
. 广告 过 期 时 间 : 不 同 网 站 分 析 系 统 对 广告 过 期 时 间 定 义 不 同 ， 如 Univetsal Analytics 默 认 广告 有 效 期 为 6 个 月 ， 该 设置 会 影响 广告 渠道 的 效果 评估 。 


. 自 定义 搜索 引擎 列表 : 在 默认 情况 下 ， 网 站 分 析 系 统 已 经 预定 义 了 绝 大 部 分 搜索 引擎 服务 提供 商 ， 如 Baidu、Bing、Yahoo 等 ; 但 地 区 性 、 个 性 化 搜索 引擎 ， 或 者 已 知 搜索 引擎 最 新 搜索 参数 可 能 未 包含 
在 内 ， 通 过 自 定 义 搜索 引擎 可 准确 识别 搜索 引擎 数据 〈 注 意 ， 新 增 搜 索引 擎 列表 数据 并 不 意味 着 会 新 增 数据 ， 只 是 将 原来 划分 到 引荐 流量 的 数据 重新 归 为 搜索 引擎 数据 。 如 原来 360 搜 索 的 数据 被 归 为 引荐 流 
新 增 360 搜 索 列 表 后 ，360 搜 索 数据 将 归 为 搜索 ， 并 且 可 识别 搜索 关键 字 ) 。 


jeg 


引荐 排除 列表 : 要 排除 菜 个 引荐 来 源 的 流量 数据 ， 可 局 用 该 功能 。 
* 排除 特定 站 外 搜索 词 : 通常 无 须 设置 ， 大 多 数据 应 用 的 场景 是 将 品牌 词 数据 从 搜索 引擎 中 排除 时 ， 以 减少 搜索 词 对 搜索 引擎 数据 的 影响 。 


" 自 定义 广告 跟踪 参数 : 站 外 特定 推广 渠道 通过 URL 的 特定 参数 实现 ， 如 Google Analytics 和 Universal Analytics 的 utm 参 数 、Webtrekk 的 wt_mc 参 数 、Adobe Analytcis 的 cmpid 参 数 、Webtrends 的 WT.mc_id 
等 。 广 告 跟踪 参数 可 自 定 义 ， 但 通常 发 生 在 网 站 分 析 系统 替换 或 多 套 网 站 分 析 系 统 并 行 时 ， 以 方便 系统 数据 衔接 并 减少 业务 工作 量 。 


四 注意 以 上 设置 不 是 必需 的 ， 只 在 需要 时 设置 。 在 设置 时 务必 确认 实施 逻辑 ， 以 免 造 成 数据 混乱 。 
2. 数 据 过 滤 规 则 


数据 过 滤 是 对 采集 到 的 数据 进行 过 滤 ， 只 保留 符合 特定 规则 的 数据 集 。 数 据 过 滤 规 则 具体 内 容 详 见 “ 数 据 采集 规则 定义 ”。 数 据 过 滤 规 则 主要 应 用 在 可 以 建立 多 个 Profile 或 有 多 个 AccountID 的 情况 
下 ， 需 要 根据 不 同业 务 模块 或 组 织 架构 进行 数据 划分 ， 以 实现 不 同 用 户 只 能 查看 特定 数据 的 需求 。 根 据 数据 的 业务 属性 进行 Profile 或 AccountlID 划 分 的 场景 ， 也 可 在 全 样 数据 下 通过 用 户 权 限 设 置 划分 不 同 
的 数据 内 容 ， 该 方式 是 付费 网 站 分 析 工 具 划 分 权重 的 主要 方法 。 


一 人 人、 


八 


人 + 羡 付费 网 站 分 析 工 具 除 GAP (Google Anaytics Premium) 外 ， 普 遍 采 用 按 Server Call 付 费 的 购买 方式 ， 建 立 多 个 Profile 或 Account 意 味 着 同样 的 数据 需要 处 理 多 次 ， 会 造成 费用 营 加 计算 从 而 提高 网 
站 分 析 工 具 的 费用 。 


3. 数 据 分 组 规则 

数据 分 组 规则 是 对 符合 特定 规则 的 数据 按照 一 定 的 类 别 进 行 划 分 。 数 据 分 组 规则 可 分 为 自动 匹配 规则 和 利用 对 照 表 归 纳 两 种 形式 。 
(1) 自动 匹配 规则 

自动 匹配 规则 是 系统 根据 设置 ， 自 动 将 符合 规则 的 数据 划分 为 一 类 。 实 现 自动 匹配 规则 的 前 提 条 件 是 : 指定 的 数据 必须 具备 规律 性 的 特征 ， 这 种 特征 的 表现 如 下 所 述 。 

:以 某 个 / 几 个 字段 开头 。 

:以 某 个 / 几 个 字段 结尾 。 

.中间 包含 某 几 个 字段 。 

数据 长 度 固 定 。 

自动 匹配 规则 具有 广泛 的 应 用 价值 ， 一 方面 可 以 实现 数据 分 类 汇总 ， 另 一 方面 可 减少 手动 整理 和 人 工 参 与 的 工作 量 ， 因 此 是 数据 分 类 的 最 佳 实现 方案 。 以 电 商 网 站 页 面 分 类 为 例 : 大 型 电 商 网 站 可 能 拥 


有 超过 百 万 级 的 网 页 数量 ， 如 果 要 宏观 掌握 网 站 在 各 个 板块 间 的 流量 分 布 必须 使 用 页 面 分 组 功能 。 网 站 板块 按 功能 可 划分 为 首页 、 列 表 页 、 终 端 页 、 超 市 页 、 活 动 页 、 购 物 车 页 、 帮 助 中 心 等 ， 针 对 每 个 板 
块 只 需 遵循 页 面 结构 定义 逻辑 即 可 。 比 如 ， 列 表 页 的 URL 结 构 特征 是 包含 /list/， 终 端 页 URL 结 构 特征 是 包含 /product/， 这 样 系统 就 可 以 直接 根据 规则 生成 页 面 分 组 数据 。 


全 ;说 自动 匹配 规则 通常 用 正则 表达 式 表 示 。 正 则 表达 式 是 数据 过 滤 、 算 选 的 重要 方式 ， 能 被 很 多 高 级 网 站 的 分 析 系 统 支持 。 


在 网 站 分 析 系 统 中 ，Webtrekk 中 的 Feed、Adobe Analytics 的 分 类 规则 生成 器 提供 了 自动 数据 分 组 功能 。 图 4-6 所 示 为 Adobe Analytics 使 用 正则 表达 式 对 一 串 字 符 中 的 特 


3 定 字符 进 
正则 表达 式 , 
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正则 表达 式 
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图 4-6 ”使 用 Adobe Analytics 正 则 表达 式 书写 的 特定 字符 分 类 
图 4-6 中 ^. (S) .* 的 意思 是 : 第 一 个 为 任意 字符 ， 第 二 个 字符 是 s， 后 面包 含 任意 一 个 任意 字符 。 根 据 这 个 规则 ，4s3234、asddd 等 都 可 以 被 过 滤 出 来 。 


(2) 利用 对 照 表 归纳 


利用 对 照 表 归纳 是 将 要 分 类 的 数据 下 载 到 本 地 ， 然 后 根据 数据 格式 整理 后 上 传 到 系统 中 进行 处 理 。 该 方法 常用 于 临时 数据 更 改 某 些 特定 数据 分 类 或 无 法 通过 自动 规则 实现 分 类 的 情况 。 


表 4-1 所 示 为 一 个 无 规律 渠道 标记 的 数据 对 照 表 。 


表 4-1 渠道 分 组 数据 
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@ia 示 对 毫 无 规律 的 字段 分 组 是 一 件 非常 复杂 的 工作 ， 在 前 期 数据 标记 或 代码 部 署 时 要 做 好 数据 特征 归 类 ， 以 便 后 期 按 自动 规则 分 类 (优先 选择 ) 或 手动 上 传 分 类 。 


数据 分 组 最 常 应 用 于 四 个 场景 : 网 站 页 面 分 组 、 销 售 商 品 分 组 、 营 销 渠 道 分 组 和 用 户 分 组 。 


和 


“网 站 页 面 分 组 。 页 面 分 组 是 页 面 分 析 的 重要 方法 ， 通 过 对 同一 类 数据 的 归纳 提供 宏观 分 析 视 角 ， 基 于 页 面 分 组 的 报表 常用 来 分 析 流量 在 网 站 不 同 板块 间 的 分 布 、 流 量 漏斗 和 转化 等 。 


* 销售 商品 分 组 。 商 品 是 电子 商务 网 站 最 关注 的 分 析 维 度 ， 通 常 网 站 商品 会 分 为 3~5 级 ， 如 网 站 一 级 类 别 可 能 包括 大 家 电 、3C、 家 居家 纺 、 五 金 建材 、 服 饰 鞋 帆 等 ，3C 中 二 级 分 类 包含 手机 、 计 算 机 和 
数据 产品 ， 手 机 的 三 级 分 类 可 再 细 分 为 手机 、 手 机 配件 、 手 机 增值 服务 等 。 


. 营销 渠道 分 组 。 营 销 渠 道 通常 根据 推广 业务 架构 进行 划分 ， 通 常 至 少 分 为 两 个 层次 : 第 一 层次 是 推广 模块 级 别 ， 如 所 有 付费 推广 渠道 可 划分 为 广告 、SEM、 新 媒体 、EDM、CPS、BD 等 模块 ; 第 二 层 
务 杂 


杂 ， 推 广 渠 道 越 多 ， 需 要 划分 的 层次 也 会 越 多 ， 原 来 的 两 层 分 组 可 能 需 


次 是 具体 渠道 名 称 ， 如 SEM 可 细 分 为 百度 、 谷 歌 等 。 业 需要 分 为 三 层 甚至 更 多 。 比 如 广告 的 分 组 ， 可 能 在 原 有 两 层 分 类 的 基 


础 上 ， 中 间 再 加 入 广告 形式 分 组 ， 根 据 合 作 形 式 可 分 为 CPD ( 包 段 广告 ， 包 段 广 告 又 可 分 为 banner、 弹 窗 、 对 联 等 ) 、 个 性 化 推荐 广告 (如 根据 用 户 行为 定向 推荐 商品 的 RTB 广 告 ) 、CPA (按照 特定 效果 进 
行 付费 ， 如 每 个 注册 算 2 元 ) 、CPC (以 单 次 点 击 购买 的 广告 ) 等 。 


:用户 分 组 。 用 户 分 组 是 对 具有 特定 特征 的 用 户 进行 划分 ， 该 特征 通常 是 对 实名 用 户 开 展 的 精准 分 析 活 动 ， 如 根据 用 户 登 录 后 的 ID 匹配 用 户 年 龄 段 、 性 别 等 ， 以 此 将 CRM 中 的 数据 丰富 到 网 站 分 析 中 。 


Adobe Analytics 的 Saint、Webtrekk 的 类 别 模块 都 可 以 实现 对 照 表 分 组 功能 。 图 4-7 所 示 为 Webtrekk 针 对 数据 类 别 的 扩展 。 


内 容 组 3110 图 | 产品 关 判 3/10 国 | 尝 休 类别 0/10 国 | 时 间 类 曾 1/10 晤 | CRM 尖 曾 210 加 | 
标量 增 注 


一 级 内 举 
二 明美 别 
三 级 类 别 


图 4-7 Webtrekk 针 对 数据 类 别 的 扩展 


4. 指 定 变 量规 则 

大 型 网 站 分 析 系 统 中 自 定义 维度 和 指标 都 需要 指定 变量 ， 目 的 是 告诉 系统 该 变量 存储 的 是 什么 信息 、 数 据 源 从 哪 来 、 如 何 处 理 直 接 得 到 的 数据 源 等 。 

(1) 变量 的 基本 设置 

变量 名 、 变 量 对 应 的 部 分 ID、 过 期 时 间 、 数 据 类 型 、 数 据 计算 逻辑 (计算 记录 数 还 是 计算 数据 汇总 值 ) 等 。 其 中 最 重要 的 是 变量 对 应 的 部 分 1D。 

举例 : 以 Adobe Analytics 为 例 ， 为 了 提高 站 内 搜索 用 户 的 体验 ， 需 要 跟踪 用 户 搜 索 后 返回 的 结果 数 (比如 用 户 搜索 了 A 关键 字 ， 返 回 结 果 是 100 条 还 是 10 条 ) ， 实 现 此 功能 需要 单独 设置 一 个 变量 来 记 
录 该 数据 。 


步骤 一 : 底层 代码 部 署 实施 ， 使 用 eVar 7 为 返回 关键 字数 据 ， 搜 索 某 个 关键 字 后 返回 代码 如 下 。 
S .eVar7=1033; 


步骤 二 : 在 Adobe Analytics 后 台中 ， 启 用 变量 并 设置 相关 参数 ， 如 图 4-8 所 示 。 


日 Evar #7 
状态 
回 | 启 用 


名 称 分 配 过 期 时 间 
固 | 搜索 结 果 数 固 | 最近 【 上 一 个 ) | 回 访问 
类 型 重 置 启用 促销 
回 | 文 本 字符 | 回 | 不 重 置 四 | 禁用 


图 4-8 ”Adobe Analytics 后 台中 eVatr 变 量 的 配置 


经 过 以 上 两 步 设 置 ， 在 完成 数据 收集 并 处 理 后 ， 前 台数 据 报 告 即 可 使 用 。 
网 站 变量 数据 有 两 个 来 源 : 一 是 通过 网 站 跟踪 代码 采集 (上面 的 例子 属于 这 种 情况 ) ; 二 是 外 部 数据 导入 。 对 于 外 部 数据 导入 ， 同 样 需 要 提前 设置 。 如 图 4-9 所 示 ， 人 在 针对 付款 状态 的 变量 参数 中 ， 数 据 
源 需 要 与 外 部 销售 系统 同步 ， 因 此 数据 源 需要 选择 映射 表 。 


图 4-9 ”Webttekk 后 台 变 量 配置 


(2) 查找 蔡 换 规则 
查找 蔡 换 规则 是 将 特定 值 的 格式 进行 蔡 换 甚至 更 改 具 体 值 。 
数据 格式 的 蔡 换 最 常用 的 是 大 小 写 转换 ， 常 用 于 网 站 URL 中 大 小 写字 母 混 用 导致 同一 条 数据 记录 被 分 拆 成 多 条 记录 的 情况 ， 为 了 正确 反映 数据 记录 需要 统一 大 小 写 。 表 4-2 所 示 为 两 个 URL 地 址 指向 同一 


个 页 面 ， 由 于 网 站 URL 结 构 不 规范 出 现 了 大 小 写 不 同 的 两 条 记录 ， 该 记录 在 数据 报告 中 会 显示 为 两 条 记录 ， 此 时 可 使 用 查找 蔡 换 功能 


表 4-2 ”同一 个 页 面 的 两 个 URL 地 址 


URL 地 址 
http:W www.searchmarketingart.com/about-author 


http:A www.searchmarketingart.com/About-Author 


查找 蔡 换 还 可 用 于 特定 值 的 更 改 蔡 换 。 在 上 面 的 分 组 设置 中 ， 我 们 提 到 了 自动 分 组 和 对 照 表 归 纳 两 种 方法 ， 但 我 们 还 可 以 使 用 第 三 种 方法 来 实现 一 一 替换 ， 蔡 换 的 实现 逻辑 与 分 组 规则 类 似 ， 只 不 过 使 


用 蔡 换 功能 后 ， 只 显示 蔡 换 后 的 值 ， 而 原始 值 无 法 显示 。 这 种 替换 功能 适用 于 具有 多 个 Profile 或 AccountID 的 账户 。 
如 图 4-10 所 示 ， 利 用 Google Analytics 中 的 搜索 替换 规则 把 所 有 从 “/products/” 开 始 到 结尾 的 URL 字 符 全 部 替换 成 “产品 列表 页 ”。 配 置 完成 后 的 “网 页 ”数据 报告 中 ， 将 不 再 出 现 包 


含 “/products/” 及 之 后 的 数据 记录 ， 其 数据 记录 全 部 被 替换 成 “产品 列表 页 ”字样 ， 如 图 4-11 所 示 。 
过 洪 奋 信息 


过 滤 弟 和 名称 | 产品 列表 内 


同 预定 对 波 老 篇 


| /products/.- 
产品 列表 内 


图 4-10 ”Google Analytics 查 找 与 替换 设置 


唯一 身份 浏览 县 平均 更 面 停 窗 时 间 


1 pn 


-com 产品 列表 页 由 


图 4-11 Google Analytics 网 页 数据 报告 


(3) 数据 组 合 规则 


数据 组 合 规则 是 将 不 同 的 值 按照 一 定 的 逻辑 进行 “合并 ”并 形成 新 的 值 ， 其 功能 类 似 于 Excel 中 的 CONCATENATE 函 数 。 
数据 组 合 规则 通常 用 于 合并 零散 数据 为 新 的 数据 ， 如 Google Analytics 的 URL 报 表 中 ， 默 认 只 显示 URL 中 域名 之 后 开始 的 目录 和 文件 部 分 ， 而 隐藏 了 Http 协 议和 主机 名 。 比 
如 http:/M/www.searchmarketingart.com/ 只 显示 为 “/”， 这 种 做 法 的 弊端 在 于 当 网 站 中 通常 存在 多 个 域名 时 ，URL 中 的 目录 和 文件 结构 可 能 相同 ， 这 会 导致 在 URL 报 表 中 无 法 区 分 。 比 
如 http://www.searchmarketingart.com/ 和 http://webtrekk.searchmarketingart.com/ 都 会 显示 为 “/”， 此 时 无 法 分 辨 两 个 URL 的 具体 数据 。 


图 4-12 所 示 为 Google Analytics 显 示 HTTP 协 议和 主 域名 的 配置 方法 。 


轩 预 正光 对 流 妖 图 目 


名 排除 
@@ 卫 合 
是 小 瑟 
@ 大 写 
名 搜索 和 薪 摘 
图 高 级 


字段 A-> 提取 A | 主机 名 革 | 
字段 B> 提 取 B | 请 求 URL lel” 
输出 至 -> 构造 器 | 请 求 URL |e)l ntpWsAtse 


图 4-12 ” Google Analytices 利 用 高 级 规则 显示 完整 的 URL 


5. 模 型 计算 规则 


模型 计算 规则 是 为 了 满足 特定 功能 而 配置 的 计算 逻辑 ， 这 种 规则 常见 于 高 级 网 站 分 析 系 统 。 常 见 的 模型 计算 规则 配置 包括 订单 归 因 模型 配置 、 路 径 功 能 配置 、 关 联 模型 配置 、 异 常 检 测 模型 配置 。 


(1) 订单 归 因 模型 配置 

归 因 模型 是 用 来 衡量 在 用 户 从 第 一 次 进入 网 站 到 最 后 一 次 进入 网 站 成 单 时 ， 所 有 来 源 渠 道 对 订单 的 贡献 作用 。 传 统 的 网 站 分 析 工 具 把 订单 归 因 为 最 后 一 次 来 源 渠 道 (在 此 不 考虑 渠道 覆盖 规则 ) ， 但 实 
际 上 其 他 渠道 对 用 户 订单 转化 同样 具有 贡献 作用 ， 该 作用 于 直接 “辅助 ”最 后 一 个 渠道 成 单 。 

举例 : 用 户 从 周一 到 周三 分 别 通过 A、B、(C 进 入 网 站 ， 并 在 第 三 次 成 单 ， 如 图 4-13 所 示 。 传 统 的 网 站 分 析 工 具 认 为 该 订单 由 渠道 C 贡 献 ， 但 渠道 A 和 B 同 样 具有 订单 贡献 作用 ， 渠 道 A 起 到 了 流量 引入 作 
用 ， 是 整个 订单 周期 的 开始 ;渠道 B 辅 助 用 户 进入 ， 提 高 了 用 户 的 购买 意向 ;渠道 C 也 许 只 是 用 户 最 后 的 入 口 ， 如 果 没有 A 和 B 的 “辅助 ”， 也 许 不 会 出 现 C 的 订单 贡献 。 


hp 一 < 一 


第 一 天 第 二 天 和 二 


Ms 


区 


在 实际 业务 中 ，SEM 品 牌 词 流量 、 直 接 输入 流量 、 网 址 导航 直接 进入 网 站 的 流量 质量 都 非常 高 ， 原 因 是 用 户 认 知 度 、 认 可 度 和 忠诚 度 比较 高 。 但 如 果 因 此 只 投放 这 些 “ 收 口 ” 渠 道 而 忽视 其 他 渠道 ， 
些 “ 收 口 ”渠道 效果 是 否 还 能 持续 ? 
订单 归 因 模 型 就 是 用 来 解决 订单 如 何 分 配 的 问题 。 除 了 传统 的 归 因 于 最 后 进入 的 渠道 外 ， 订 单 归 因 模型 还 包括 归 因 于 最 初 进入 的 渠道 、 线 性 平均 归 因 、 随 时 间 衰 减 归 因 、 根 据 位 置 的 综合 归 因 等 。 


下 面 以 一 个 实际 案例 来 说 明 不 同 归 因 模型 下 各 个 渠道 的 订单 贡献 情况 。 案 例 说 明 : 用 户 打算 在 某 网 站 购买 商品 ， 第 一 天 从 Sina Banner 进 入 浏览 了 该 网 站 的 某 个 活动 ; 第 二 天 在 微 博 上 看 到 该 活动 的 推 
广博 文 点 击 进入 网 站 ， 并 详细 看 了 其 中 某 个 活动 单 品 ; 第 三 天 该 用 户 在 搜索 引擎 中 搜索 了 该 单 品 ， 并 点 击 进入 该 网 站 继续 查看 ; 第 四 天 用 户 在 其 他 网 站 看 到 有 该 网 站 的 合作 推广 单 品 ， 点 击 进入 该 网 站 但 仍 
未 成 单 ; 第 五 天 该 用 户 最 终 搜 索 品 牌 关键 字 ， 点 击 品牌 区 进入 网 站 完成 订单 。 用 户 在 整个 订单 周期 内 访问 的 路 径 如 图 4-14 所 示 。 


Sina Banner 


站 光 直下 稍 助 渠道 


图 4-14 用 户 在 整个 订单 周期 内 访问 的 路 径 
在 不 同 的 订单 归 因 模 型 中 各 渠道 的 贡献 如 下 。 


归 因 于 最 后 进入 的 渠道 : 最 终 互动 模型 将 100% 的 转化 价值 归功 于 客户 在 进行 购买 或 转化 之 前 与 之 互动 的 最 后 一 个 渠道 。 在 本 案例 中 ，SEM 品 牌 区 订单 贡献 为 100%， 其 他 渠道 订单 贡献 为 0。 适 用 场景 
为 广告 和 推广 活动 的 目的 是 在 购买 时 吸引 用 户 ， 或 者 企业 业务 主要 参与 的 销售 周期 不 涉及 观望 阶段 。 


归 因 于 最 初 进入 的 渠道 : 将 100% 的 转化 价值 归功 于 客户 与 之 互动 的 第 一 个 渠道 。 在 本 案例 中 ，Sina Bannet 订 单 贡献 为 100%， 其 他 渠道 订单 贡献 为 0。 适 用 场景 为 广告 或 推广 骨 在 建立 最 初 的 认 知 度 ， 
品牌 并 不 为 人 熟知 ， 企 业 前 期 的 推广 重点 放 在 品牌 曝光 下 ， 那 么 首次 进行 品牌 展示 的 媒介 是 重点 关注 媒介 。 


“ 线性 平均 归 因 : 将 功劳 平均 分 配给 转化 路 径 中 的 每 个 渠道 。 在 本 案例 中 ， 每 个 渠道 的 订单 贡献 都 是 25%。 适 用 场景 为 如 果 广 告 或 推广 活动 的 目的 是 在 整个 销售 周期 内 保持 与 客户 的 联系 并 维持 品牌 的 
认 知 度 ， 则 适合 使 用 此 模型 。 在 这 种 情况 下 ， 每 个 接触 点 在 客户 考虑 的 过 程 中 都 同等 重要 。 


` 随时 间 衰减 归 因 : 如 果 销 售 周期 中 涉及 的 考虑 阶段 较 短 ， 那 么 更 适合 时 间 衰 减 模式 。 该 模型 向 最 接近 转化 发 生 时 间 的 互动 分 配 最 多 的 功劳 。 在 本 案例 中 ， 不 同 渠 道 的 订单 贡献 作用 与 其 最 后 接触 的 时 
间 相 关 ， 渠 道 位 置 离 订 单 转化 越 近 ， 订 单 贡 献 作 用 越 大 ， 因 此 各 个 渠道 的 订单 贡献 作用 依次 为 : SEM 品 牌 区 > 友情 链接 >SEM 关 键 字 > 微 博 >Sina Bannet。 适 用 场景 为 如 果 投 放 短 期 的 促销 广告 活动 ， 可 能 和 希望 
将 更 多 的 功劳 分 配给 促销 期 间 产 生 互动 的 媒介 ， 在 这 种 情况 下 ， 与 接近 转化 的 接触 点 相 比 ， 一 周 之 前 发 生 的 互动 只 有 很 少 的 价值 。 通 常 在 企业 大 促销 的 情况 下 这 种 模型 较为 合适 ，“ 时 间 衰 减 ” 模 式 能 够 适 
当地 将 功劳 分 配给 促成 转化 前 一 两 天 的 接触 点 。 


. 根据 位 置 的 综合 归 因 : 结合 了 以 上 全 部 模型 因素 ， 根 据 不 同 渠 道 在 整个 订单 周期 内 的 位 置 进行 权重 分 配 。 在 本 案例 中 ， 不 同 渠 道 的 订单 贡献 根据 设置 而 定 ，Google Analytics 将 权重 划分 为 最 终 进 入 渠 
道 、 中 间 辅 助 渠 道 、 最 终 转 化 渠道 三 类 ; Webttekk 将 渠道 归 因 细 分 到 五 个 位 置 ， 即 第 一 进入 渠道 、 第 二 渠道 、 其 他 〈 中 间 渠 道 ) 、 倒 数 第 二 渠道 、 末 端 渠 道 。 对 位 置 的 定义 越 详 细 ， 可 以 细 分 的 维度 和 视角 


越 多 。 图 4-15 所 示 为 Webtrekk 根 据 位 置 的 多 重 归 因 模型 。 适 用 场景 为 侧重 于 对 用 户 整 个 转化 周期 内 所 有 渠道 的 评估 ， 适 用 于 大 多 数 的 企业 场景。 


只 考虑 站 外 广告 媒体 

以 下 来 产 的 广告 媒体 会 被 作为 普通 广告 媒体 处 理 : 
搜索 引 训 其 化 

其 它 访问 源 

守 区 媒体 访问 闽 
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图 4-15 Webtrekk 订 单 根据 位 置 的 多 重 归 因 模 型 


ia 对 于 根据 位 置 综 合 归 因 的 模型 ， 权 重 分 配 通 党 
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后 进入 渠道 订单 贡献 较 大 ， 其 他 渠道 贡献 较 弱 。 如 图 4-15 中 默认 第 一 和 末端 渠道 权重 分 别 为 30% 和 40%， 其 他 渠道 权重 平 


(2) 路 径 功能 配置 


路 径 指 的 是 用 户 在 网 站 不 同 页 面 间 的 流量 动向 ， 也 可 以 指 不 同 用 户 行为 事件 间 的 前 后 访问 关系 。 所 有 的 路 径 功能 都 是 以 用 户 1D 或 访客 ID 为 唯一 用 户 识别 标识 的 ， 以 不 同 页 面 、 事 件 、 目 标 、 转 化 等 时 间 
戳 排 序 生 成 路 径 。 路 径 功能 是 将 网 站 分 析 由 点 带 入 线 的 重要 功能 ， 它 拓展 了 传统 网 站 分 析 只 能 针对 某 个 维度 分 析 的 狭窄 视角 ， 使 基于 维度 的 前 后 关系 的 数据 分 析 能 力 得 到 提升 。 


路 径 功能 在 页 面 、 目 标 、 事 件 和 转化 上 应 用 较为 广泛 ， 形 成 页 面 流 、 目 标 流 、 事 件 流 、 转 化 流 等 。 大 多 数 情 况 下 路 径 功 能 无 须 设置 ， 只 需要 直接 应 用 即 可 。 


页 面 路 径 常用 于 分 析 不 同 页 面 引流 和 前 后 路 径 关 系 ， 如 用 户 从 活动 页 落地 后 如 何 分 流 、 典 型 客户 (购买 某 品 类 ) 的 路 径 特 征 、 客 户 网 站 访问 动向 、 页 面 广告 资源 挖掘、 站 内 多 页 面 流 程 设计 优化 等 。 大 
多 数 网 站 分 析 系 统 只 能 提供 基于 流量 (通常 是 PV) 的 单 维度 路 径 ， 有 些 强大 的 分 析 系 统 或 插件 能 实现 三 维 路 径 分 析 ， 图 4-16 所 示 为 Discover 的 页 面 路 径 分 析 功 能 ， 它 提供 了 三 个 维度 的 分 析 视 角 并 通过 立体 
图 形 展示 ， 其 中 每 个 维度 的 指标 都 可 以 自 定义 。 不 仅 如 此 ， 图 中 黄色 区 域 是 增强 路 径 图 ， 该 图 支持 缩放 功能 ， 并 且 可 以 进行 三 维 旋转 。 


X 办 : 每 次 访问 的 平均 页 面 查看 次 数 颜色 - 每 次 访问 的 平均 页 面 查看 次 数 
Y 办 : 平均 页 面 深度 低 ER 高 
柱 体 宽度 - 访问 第 头 粗细 - 流 员 

柱 体 高 度 : 页 面 查看 次 数 


网 站 分 析 显示 设置 


嘿 度 ”一般 和 警报 

柱 体 盟 度 

柱 体育 度 访问 

柱 体高 度 。 页 面 查看 次 数 

睫 色 每 次 访问 的 平均 页 面 查看 次 数 


低 | 二 
后 折 


坐标 轴 量 度 

X 轴 每 次 访问 的 平均 页 面 查看 次 数 
Y 轴 平均 页 面 深度 

其 它 最 广 


图 4-16 ”Discover 三 维 页 面 路 径 图 


@ 小 Discovetr 是 Adobe Analytics 的 一 部 分 ， 通 常 翻译 为 临时 分 析 。Discover 类 似 于 一 个 数据 分 析 的 工作 人 台 ， 所 有 的 数据 维度 、 粒 度 、 指 标 都 可 以 任意 拖 找 ， 同 时 支持 无 限 下 钼 ， 它 的 功能 非常 强大 ， 
在 经 验 丰 富 、 能 力 出 众 的 分 析 师 的 应 用 下 ， 它 的 分 析 能 力 几 乎 是 无 穷 的 。 


目标 路 径 、 事 件 路 径 、 转 化 路 径 是 指 用 户 在 不 同 目标 、 事 件 和 转化 之 间 的 流量 转换 和 交互 ， 应 用 侧重 于 不 同 转化 之 间 的 完成 和 流转 关系 。 漏 斗 功能 也 可 以 实现 不 同 对 象 间 完 成 关系 的 分 析 ， 其 与 路 径 的 
区 别 在 于 : 路 径 可 以 形象 地 表现 用 户 在 所 有 对 象 间 的 行为 天 系 ， 表 现在 从 任意 一 个 节点 转换 到 其 他 任意 节点 ， 完 整 履 盖 用 户 在 所 有 对 象 间 的 访问 ;而 漏斗 只 能 看 到 用 户 从 上 一 级 节点 到 下 一 级 节点 的 转化 天 
系 。 


图 4-17 所 示 为 一 个 目标 路 径 ， 其 中 定义 了 注册 和 预 注册 成 功 。 根 据 目 标 路 径 可 发 现 ， 用 户 的 路 径 并 不 是 完全 按照 网 站 设计 的 路 径 首页 一 列表 页 一 产品 页 一 购物 车 页 的 顺序 ， 而 是 流量 直接 到 达 产 品 页 ， 
部 分 用 户 从 列表 页 直接 加 入 购物 车 而 未 查看 商品 的 详细 信息 ， 而 且 这 部 分 用 户 的 比例 超过 从 产品 页 进入 购物 车 的 用 户 。 
通过 站 外 渠道 路 径 分 析 ， 我 们 不 仪 可 以 分 析 用 户 是 从 哪个 渠道 来 的 ， 更 可 以 分 析 用 户 在 到 达 该 渠道 之 前 是 从 哪个 渠道 来 的 ， 
使 用 的 “偏好 路 径 ”。 如 有 的 用 户 习惯 于 从 A 一 B 进 入 网 站 成 单 ， 有 的 用 户 习惯 于 从 A 一 C 一 B 成 单 ， 还 有 的 用 户 习 惯 于 从 


路 径 功能 的 作用 不 限于 站 内 用 户 行为 分 析 ， 还 可 应 用 于 站 外 渠道 
之 后 又 会 从 哪个 渠道 进入 网 站 ， 在 最 终 形成 的 转化 路 径 中 ， 到 底 哪 些 路 径 是 用 户 最 
A 一 A 一 A 一 B 成 单 。 
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图 4-17 Universal Analytics 目 标 路 径 


站 外 渠道 路 径 分 析 可 以 得 到 汇总 级 别 的 路 径 数据 ， 如 SEM、 广 告 、 新 媒体 等 推广 模块 之 间 用 户 的 交叉 访问 行为 ， 又 可 以 细 分 渠道 如 新 浪 广告 、 微 博 、 暴 风 影 音 等 渠道 的 用 户 访问 行为 ， 甚 至 还 可 以 细 分 
到 SEM 中 用 户 到 达 网 站 关键 字 之 间 的 路 径 数据 。 图 4-18 所 示 为 不 同 渠道 之 间 的 路 径 数 据 。 
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Facebookkbk Facebookbk Facebookbk Facebook | 202 #0 二 
图 4-18 不 同 渠 道 之 间 的 路 径 数据 
基于 以 上 推广 模块 、 渠 道 设置 细 分 关键 字 的 路 径 信息 ， 我 们 能 应 用 到 哪些 业务 场景 呢 ? 


* 整合 营销 传播 是 否 适 用 于 企业 推广 ?如 果 数 据 发 现 大 部 分 用 户 只 通过 一 个 渠道 进入 网 站 就 可 以 成 单 ， 而 对 其 他 渠道 的 交叉 访问 或 依赖 关系 较 弱 ， 是 否 间 接地 说 明了 渠道 整合 程度 较 低 或 目前 不 具有 太 
大 的 重要 性 ? 


* 拓展 了 渠道 评估 的 视野 。 在 做 渠道 效果 评估 时 ， 除 了 评估 渠道 的 CPC、ROI、 转 化 率 、 订 单 成 本 等 指标 外 ， 还 需要 综合 分 析 该 渠道 对 其 他 渠道 的 “辅助 ”引流 和 订单 贡献 作用 。 


渠道 落地 细节 优化 。 在 转化 路 径 中 ， 不 同 推广 渠道 是 否 具 有 明显 的 位 置 特点 或 集中 趋势 ? 如 展示 类 、 广 告 类 渠道 明显 处 于 用 户 转化 路 径 的 前 期 ， 距 离 订 单 转化 点 较 远 ; SEM 和 直接 输入 明显 处 于 转化 
的 末端 ， 距 离 订单 转化 点 较 近 。 在 广告 投放 时 ， 是 否 可 以 综合 考虑 各 个 渠道 的 媒体 排 期 ? 针对 不 同 渠 道 间 的 交叉 访问 ， 是 否 存在 流量 交叉 履 盖 或 需要 关联 投放 ? 整个 广告 活动 的 前 、 中 、 后 期 的 推广 策略 ， 
如 何 根据 路 径 的 渠道 顺序 、 转 化 时 间 进 行 优化 ? 


(3) 关联 模型 配置 
数据 挖掘 和 网 站 分 析 在 大 多 数 情况 下 属于 两 个 领域 ， 网 站 分 析 系 统 对 数据 挖掘 算法 的 应 用 较 少 ， 现 介绍 Webtrekk 系 统 集成 的 数据 挖掘 算法 及 其 应 用 。 


Webtrekk 系 统 将 关联 模型 算法 封装 到 底层 算法 ， 该 算法 可 以 应 用 于 页 面 关联 分 析 、 站 内 外 搜索 词 关联 分 析 、 产 品 浏览 关联 分 析 、 产 品 购买 交叉 分 析 、 渠 道 访问 交叉 分 析 。 在 使 用 该 报表 和 数据 之 前 ， 需 
要 先 在 Webtrekk 系 统 中 配置 关联 模型 的 相关 维度 和 参数 ， 如 图 4-19 所 示 。 


.关联 分 析 的 算法 支持 交叉 销售 算法 和 向 上 销售 算法 两 种 ; 

. 数据 集 都 是 基于 Raw Data (原始 在 线 采 集 数据 ) ; 

* 数据 计算 时 间 可 设置 为 每 天 、 每 小 时 或 一 次 ; 

* 挖掘 维度 支持 页 面 、 渠 道 、 产 品 、 广 告 、 站 内 外 搜索 词 的 浏览 和 购买 关联 ; 


“ 支持 数据 挖掘 的 高 级 配置 。 支 持 最 小 频繁 度 ， 分 析 类 别 选 择 追 加 销售 序列 分 析 时 还 可 设置 追加 的 数据 集 时 间 ， 支 持 基 于 细 分 群体 的 关联 ， 如 只 看 某 个 页 面 的 关联 效果 ， 只 需要 过 滤 该 页 面 即 可 。 


追加 钠 缠 序列 分 析 


高 银 芭 站 


最 小 频次 1 |% 通过 这 个 本 置 ， 你 可 以 排除 罕见 的 规则 。 
站 加 稍 焦 时 间 段 30 第 一 个 时 间 过 后 的 天 数 。 
中 鸭 


图 4-19 Webtrekk 关 联 模型 配置 


实施 配置 并 完成 数据 处 理 后 ， 数 据 报告 如 图 4-20 所 示 。 
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图 4-20 Webttekk 渠 道 关 联 报表 数据 

Webtrekk 的 关联 模型 应 用 范围 广泛 ， 它 可 以 提供 以 下 数据 价值 洞察 : 

. 用 户 搜索 了 站 内 A 关键 词 之 后 通常 会 优化 搜索 哪个 关键 词 ? 

. 用 户 在 看 了 A 页 面 之 后 ， 通 常 还 会 看 哪个 页 面 ? 

. 用 户 买 了 A 产品 之 后 ， 还 会 一 起 买 哪个 产品 ?下 次 又 会 买 哪个 产品 ? 


: 用 户 从 A 渠道 进入 网 站 之 后 ， 通 常 还 会 从 哪个 渠道 再 次 进入 ? 
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在 所 有 的 数据 挖掘 类 算法 中 ， 规 则 提取 类 是 最 受 业务 应 用 关注 的 算法 ， 原 因 是 提取 后 的 规则 可 直接 帮助 业务 开展 业务 活动 ， 实 用 价值 最 高 (规则 提取 类 算法 包括 关联 、 回 归 、 决 策 树 等 以 直接 目标 为 分 
析 导 向 ， 提 取 能 实现 目标 规则 的 算法 ， 如 购买 A 产品 的 用 户 下 一 次 通常 会 购买 B 产 品 ) 。 


(4) 异常 检测 模型 配置 


型 是 通过 一 定 的 数据 挖掘 算法 ， 发 现 不 符合 数据 趋势 中 异常 点 的 一 类 数据 分 析 方 法 ， 该 模型 目前 仪 在 Adobe Analytics 中 提供 。 数 据 异常 检测 可 以 从 “噪声 ”分 开 “ 真 正 的 信号 ”， 然 后 确定 
导致 这 些 信号 或 异常 现象 的 潜在 因素 。 换 句 话说 ， 它 可 以 让 你 识别 哪些 是 真正 的 异常 ， 然 后 有 针对 性 的 寻找 原因 。 此 外 ， 还 可 以 得 到 可 靠 的 指标 (KPI) 预测 值 。 包 括 以 下 常用 场景 : 


* 监测 网 站 平均 订单 价值 、 订 单 量 、 订 单 转 化 率 波 动 。 
“ 注册 或 登录 的 异常 变化 。 
" 茶 个 登录 页 面 浏览 量 趋势 。 
“ 正在 投入 巨额 广告 费 的 渠道 效果 波动 。 
- 网 站 跳出 率 情况 是 否 正 常 波动 。 
如 图 4-21 所 示 是 某 网 站 针对 跳出 率 的 一 个 异常 检测 报告 结果 ， 它 提供 了 以 下 几 个 信息 点 : 
* 是 否 异常 : 是 。 
“ 几 个 异常 点 : 1 个 。 


. 异常 时 间 : 11 月 12 日 。 


. 如 何 异 常 : 跳出 率 高 于 预测 区 间 的 上 限 。 
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图 4-21 Adobe Analytics 异 常 检测 报表 


Adobe Analytics 使 用 的 是 时 间 序 列 的 预测 方法 ， 由 三 种 算法 组 成 : 


. Holt Winters Multiplicative (Triple Exponential Smoothing) 一 一 堆 尔 特 温 特 斯 乘法 (三重 指 数 平滑 法 ) 。 
. Holt Winters Additive (Triple Exponential Smoothing) 一 一 霍 尔 特 温 特 斯 加 法 (三 重 指数 平滑 法 ) 。 


* Holts Trend Cotrrected (Double Exponential Smoothing) Holts 趋 势 校 正 〈 双 指数 平滑 法 ) 。 


这 三 种 算法 实际 上 共同 组 成 了 温 特 斯 季节 指数 平滑 模型 ， 其 基本 思想 是 把 具体 线性 趋势 、 季 节 变 动 和 随机 变动 的 时 间 序列 进行 分 解 研究 ， 并 与 指数 平滑 法 相 结合 ， 分 别 对 长 期 趋势 (Ut) 、 趋 势 的 增 量 
(Bt) 和 季节 变动 (Ft) 作出 估计 ， 与 指数 平滑 法 结合 起 来 ， 可 以 同时 处 理 趋势 和 季节 性 变化 ， 并 能 将 随机 波动 的 影响 适当 地 过 滤 掉 ， 然 后 建立 预测 模型 。 因 此 ， 特 别 适 用 于 包含 趋势 和 季节 变化 的 时 间 序 
列 的 预测 问题 。 


该 模型 配置 比较 简单 ， 所 有 算法 都 已 经 封装 到 系统 内 部 ， 用 户 只 需要 进入 后 台 设 置 训练 数据 集 、 数 据 时 间 、 数 据 维度 即 可 。 
-数据 训练 集 的 时 间 : 数据 训练 集 ， 即 要 进行 计算 和 处 理 的 样本 数据 的 时 间 范 围 ， 《默认 截至 昨天 ) 数据 训练 集 的 时 间 可 选项 为 30 天 、60 天 、90 天 。 


“ 数据 查看 集 的 时 间 : 与 数据 训练 集 的 时 间 选 项 相同 ， 不 同 点 在 于 数据 直接 用 来 验证 训练 集 的 结果 。 


数据 指标 和 维度 : 异常 检测 可 以 针对 全 站 所 有 的 维度 和 指标 进行 预测 。 黑 认 情 况 下 ， 系 统 后 台 是 针对 全 站 的 异常 检测 配置 ， 针 对 自 定义 维度 设置 预警 需要 人 额外 配置 。 图 4-22 所 示 为 针对 BD 模 块 的 UV 预 


bd UV 监测 
Daily Unique Visitors 寺 


Module (Tracking Code) i 


图 4-22 ”针对 BD 模块 的 UV 预警 设置 


4.3.3 ”数据 转化 设置 


转化 是 一 个 广泛 的 定义 ， 转 化 意味 着 希望 用 户 在 网 站 上 实现 的 目标 或 事件 。 它 可 能 是 一 个 动作 、 一 个 订单 甚至 是 一 段 时 间 。 任 何 网 站 都 有 转化 目标 ， 常 用 的 转化 设置 包括 : 网 站 目标 设置 、 网 站 漏斗 设 
置 和 网 站 电子 商务 转化 设置 。 


1. 网 站 目标 设置 

网 站 目标 可 根据 用 户 行为 对 最 终 转化 目标 的 贡献 区 分 ， 常 分 为 以 下 四 类 : 

第 一 类 是 初级 转化 目标 ， 通 常 是 查看 类 指标 ， 是 用 户 转化 的 开始 ， 如 查看 产品 页 、 媒 体 播放 、 活 动 查看 、 查 看 货 到 付款 、 查 看 帮助 等 ; 

第 二 类 是 中 级 转化 目标 ， 通 常 是 互动 或 比较 类 指标 ， 代 表 用 户 转 化 意向 的 加 深 ， 如 搜索 功能 、 比 较 产 品 、 白 皮 书 下 载 、 添 加 收藏 来、 关注 、 评 论 、 更 新 等 ; 
第 三 类 是 高 级 转化 目标 ， 通 常 是 距离 核心 指标 较 近 的 指标 ， 是 用 户 转 化 过 程 的 必要 步骤 ， 如 用 户 注册 、 登 录 、 联 系 我 们 、 聊 天 、 加 入 购物 车 、 填 写 订 单 信息 ; 
第 四 类 是 最 终 转 化 目标 ， 也 是 核心 转化 指标 ， 如 电 商 类 网 站 的 核心 目标 是 订单 ， 软 件 销售 类 网 站 的 目标 是 获得 销售 线索 。 


以 上 四 类 指标 按照 实现 难度 由 低 到 高 依次 是 : 初级 转化 指标 < 中 级 转化 目标 < 高 级 转化 目标 < 最 终 转化 目标 ， 如 图 4-23 所 示 。 


图 4-23 ”常见 的 四 种 程度 的 转化 目标 


对 网 站 目标 的 定义 可 通过 以 下 三 种 技术 方式 实现 。 

特定 URL: 大 多 数 网 站 目标 都 对 应 着 网 站 的 特殊 页 面 ， 如 登录 成 功 后 有 登录 成 功 页 ， 注 册 成 功 后 有 注册 成 功 页 ， 定 义 这 些 “成功 ”页 就 定义 了 实现 该 目标 。 

特定 事件 : 对 于 没有 特定 页 面 或 URL 的 情况 ， 可 以 通过 事件 实现 ， 比 如 用 户 点 击 下 载 没 有 特定 页 面 ， 此 时 可 以 把 下 载 定义 为 事件 ， 完 成 该 事件 即 可 实现 该 目标 。 

特定 指标 : 如 访问 大 于 30 秒 ， 该 定义 通常 在 媒体 、 视 频 类 网 站 中 使 用 较 多 ， 其 核心 是 提高 用 户 在 网 站 的 停留 时 间 ; 媒体 类 网 站 还 可 能 定义 人 均 PV 量 ， 如 超过 10 即 定义 为 完成 一 定 的 目标 。 


以 上 三 种 方式 基本 可 以 满足 日 常 所 有 目标 跟踪 的 需求 ， 目 标 跟 中 的 关键 是 在 前 期 需要 部 署 相 关 事 件 、 页 面 或 动作 的 跟 踊 代码 。 目 标定 义 设置 的 工作 只 是 将 该 数据 提取 出 来 ， 然 后 赋予 转化 标签 。 对 于 目 
标 也 可 以 指定 值 ， 即 完成 指标 后 能 产生 多 少 价值 。 


2. 网 站 漏斗 设置 
网 站 漏斗 是 分 析 目 标 达成 的 重要 方法 ， 需 要 提前 在 系统 中 进行 设置 。 
网 站 漏斗 的 主要 对 象 是 页 面 漏斗 ， 即 从 上 一 层 页 面 到 下 一 层 页 面 还 “ 剩 ” 多 少 用 户 ， 特 定 页 面 代 表 的 特定 用 户 目标 或 价值 。 如 购物 车 漏斗 一 般 会 设置 为 加 入 购物 车 、 填 写 订 单 、 提 和 交 订 单 。 


通常 情况 下 ， 不 同 维度 的 数据 无 法 实现 混合 漏斗 ， 即 页 面 只 能 用 于 页 面 漏 斗 ; 事件 只 能 用 于 事件 漏斗 。 但 在 Discover 中 支持 页 面 、 事 件 、 访 问 定 义 的 混合 漏斗 ， 即 可 以 定义 第 一 步 是 查看 了 产品 详情 页 
(页 面 ) ; 第 二 步 加 入 购物 车 (按钮 事件 ) ; 第 三 步 是 我 的 购物 车 (页面 ) ; 第 四 步 是 提交 订单 (事件 ) 。 


四 注意 所 有 数据 处 理 类 的 功能 ， 其 数据 处 理 仅 发 生 在 配置 完成 之 后 ， 这 意味 着 配置 之 前 的 数据 不 能 被 处 理 。 如 在 3.1 配 置 了 漏斗 ， 漏 斗 数 据 只 从 3.1 开 始 处 理 ， 之 前 的 漏斗 数据 是 没有 的 。 因 此 ， 在 网 
站 分 析 系 统 建立 之 初 就 需要 完成 所 有 的 系统 配置 工作 。 


3. 网 站 电子 商务 转化 设置 

网 站 电子 商务 转化 设置 指 电子 商务 设置 ， 转 化 设置 不 是 必需 的 ， 可 根据 系统 要 求 而 定 。 对 于 部 分 网 站 分 析 系 统 ， 电 子 商 务 跟踪 分 为 以 下 两 步 。 
步骤 一 : 在 页 面 伐 入 电子 商务 跟踪 代码 ， 

步骤 二 : 在 系统 后 台 启 用 电子 商务 跟踪 功能 。 


电子 商务 跟踪 包括 启用 电子 商务 功能 、 设 置 货币 符号 ， 某 些 全 球 性 的 客户 还 需要 进行 货币 转换 。 通 常 全 球 性 的 客户 都 以 美元 为 最 终结 算 货币 ， 其 他 国家 都 有 自己 的 货币 ， 在 数据 采集 和 处 理 过 程 时 使 用 
各 国 自身 的 货币 ， 最 后 统一 结算 时 用 指定 的 货币 。 


电子 商务 转化 与 目标 设置 都 能 跟踪 订单 ， 两 者 的 区 别 在 于 : 目标 仪 能 监测 订单 实现 了 多 少 次 (计数) ,电子 商务 跟踪 不 但 能 监测 次 数 ， 而 且 能 监测 订单 的 详细 信息 ， 包 括 : 订单 产品 、ID、 数 量 、 优 惠 
券 、 送 货 方式 、 支 付 方式 等 。 
4.3.4 数据 整合 设置 

数据 整合 设置 是 数据 集成 的 规则 ， 包 括 数据 导入 设置 和 自 定 义 端口 配置 。 

1. 数 据 导入 设置 

外 部 数据 导入 是 网 站 系统 功能 强大 与 否 的 重要 参考 标准 ， 数 据 扩展 性 意味 着 有 更 多 维度 、 更 准确 的 数据 可 供 分 析 和 辅助 决策 。 数 据 导 入 规则 通常 通过 Excel、APl 等 形式 导入 系统 。 


例如 : 对 在 订单 的 跟踪 过 程 中 ， 除 了 常用 的 订单 1D、 订 单价 值 、 订 单产 品 、 数 量 等 常规 参数 外 ， 还 可 以 通过 自 定 义 的 形式 定义 额外 的 字段 ， 如 产品 尺寸 、 产 品 颜色 、 订 单 优惠 券 、 订 单 折扣 等 ， 这 些 字 
段 除 了 在 部 署 阶段 可 以 采集 ， 还 可 以 在 后 期 系统 配置 中 上 传 。 


2. 自 定义 端口 配置 
自 定 义 端口 配置 是 指针 对 系统 数据 对 接 、 界 面 化 的 API 操 作 方式 。 这 些 端口 用 来 做 系统 数据 整合 使 用 ， 企 业 做 数据 对 接 时 只 需要 配置 相应 的 参数 和 值 即 可 。 


自 定义 端口 功能 越 强 大 、 对 接 的 数据 系统 越 多 ， 越 利于 数据 整合 的 实现 。 因 此 数据 端口 开发 完善 度 是 衡量 一 款 网 站 分 析 系 统 数据 整合 能 力 的 重要 因素 。 自 定义 端口 使 企业 无 需 调 用 资源 进行 数据 API 开 
发 ， 同 时 最 大 化 的 提高 数据 对 接 的 准确 性 和 稳定 性 。 该 功能 对 于 国外 的 网 站 分 析 产 品 非常 重要 ， 尤 其 是 国内 重要 的 推广 资源 如 百度 、 腾 讯 、 新 浪 等 ， 由 于 各 方面 的 原因 ， 大 多 情况 下 国外 工具 的 自 定 义 端口 
开发 程度 较 低 。 


目前 已 经 成 型 的 自 定义 端口 包括 : Google Analytics 集 成 Adwords 和 Adsense; Webtrekk 已 经 集成 了 Facebook、Youtube、Adwords、Audiweb、Criteo 等 超过 50 个 合作 伙伴 ; Adobe Analytics 可 
以 集成 Adobe Target ( 含 Test and target、Recommendations 和 和 Search&Promote， 但 需要 单独 代码 部 署 ) ， 另 外 也 支持 通过 Adobe Genesis 集 成 第 三 方 应 用 ， 其 中 预 集成 了 75 个 认证 合作 伙伴 。 


自 定义 端口 应 用 举例 : 图 4-24 所 示 为 Webtrekk 针 对 Adwords 的 端口 配置 界面 ， 界 面 中 配置 相关 ID 和 参数 信息 后 ， 可 直接 导入 Adwords 数 据 。 
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图 4-24 Webtrekk 针 对 Adwords 的 端口 配置 界面 


4.3.5 ”数据 智能 工作 设置 


数据 智能 工作 是 指 通 过 网 站 分 析 系 统 自动 触发 或 以 智能 的 形式 自动 将 关键 信息 发 给 指定 的 对 象 。 数 据 智 能 工作 可 以 把 数据 分 析 师 从 初级 工作 中 解放 出 来 ， 同 时 还 能 提供 关键 的 解读 视角 ， 以 帮助 业务 方 
快速 掌握 信息 。 常 见 的 数据 智能 工作 应 用 包括 数据 预警 、 邮 件 自动 发送、 自动 热力 图 的 获取 、A/B 测 试 优化 功能 。 


1. 数 据 预 警 


当 相 关 维 度 的 指定 指标 达到 和 超过 标准 时 ， 通 过 电子 邮件 发 送 警 报 或 向 移动 设备 发 送 警报 提醒 相关 人 员 。 数 据 预 警 的 工作 流程 是 指定 要 监测 的 数据 维度 及 指标 ， 并 其 他 时 间 进 行 对 比 ， 当 数据 变化 超过 
一 定 国 值 时 触发 。 


数据 预警 是 日 常数 据 监 测 的 重要 手段 ， 常 用 于 日 、 周 、 月 关键 数 据 的 监控 。 数 据 分 析 师 或 业务 人 员 可 能 无 法 每 天 查看 数据 ， 或 者 即使 查看 也 不 一 定 就 能 判断 出 数据 的 异常 情况 ， 数 据 预警 直接 有 效 地 解 
决 了 这 个 问题 ， 该 功能 常用 于 以 下 方面 : 


. 重点 渠道 投放 效果 监控 ， 如 新 上 广告 、SEM 投 放 、SEO 效 果 、CPS 效 果 等 ; 
. 重点 资源 位 效果 监控 ， 如 站 内 运营 资源 位 、 广 告 位 效果 等 ; 

“ 重点 页 面 或 流程 效果 监控 ， 如 某 页 面 效 果 变 化 等 ; 

“ 全 站 关键 性 指标 ， 如 UV、 转 化 率 、 订 单 量 等 。 


四 注意 预警 适合 做 固定 或 具有 较 长 时 间 周 期 业务 的 预警 ， 不 适用 于 时 间 短 甚至 是 临时 性 业务 。 如 某 些 广告 只 投放 两 天 ， 即 使 出 现 预警 也 无 法 产生 业务 动作 ; 而 一 些 具 长 期 投放 的 业务 模块 发 生 预 警 
后 ， 可 以 针对 预警 时 间 、 媒 介 、 变 化 范围 等 分 析 原 因 ， 并 且 可 以 有 针对 性 地 进行 业务 优化 。 


2. 邮 件 自动 友 送 


很 多 领导 由 于 习惯 、 时 间 等 因素 很 少 登 录 网 站 的 数据 分 析 系 统 查看 数据 ， 而 更 倾向 于 直接 通过 邮件 系统 点 击 查看 相关 报表 。 很 多 系统 支持 自 定义 发 送 报表 ， 图 4-25 所 示 为 Google Analytics 的 自 定义 邮 
件 友 送 界面 。 


电子 邮件 报 音 : 万 页 


发 件 人 beijngtlG@gmail com 


tony.song@webtrekk com 


主题 | 数据 研究 与 隧 业 应 用 全 部 外面 数据 


附件 CSV = | 网 页 | 


发 闫 取消 


图 4-25 Google Analytics 邮 件 自动 发 送 配置 
久 沪 系统 发 出 的 邮件 可 能 会 被 企业 内 部 的 邮件 系统 误 认为 是 垃圾 邮件 ， 需 要 将 网 站 分 析 系 统 相 关 IP 地 址 或 发 送 域 加 到 邮件 系统 的 白 名 单 中 。 
3. 自 动 热 力图 的 获取 
热力 图 是 单 页 面 用 户 体验 分 析 的 重要 途径 ， 通 过 热力 图 可 以 直观 的 反映 用 户 对 于 页 面 内 容 的 喜好 程度 。 热 力图 可 分 为 基于 链接 的 热力 图 和 基于 像素 的 热力 图 。 


基于 链接 的 热力 图 反映 了 页 面 内 每 个 链接 的 点 击 情况 ， 这 种 热力 图 更 容易 以 数据 的 形式 分 析 页 面 而 不 用 功能 间 的 点 击 分 布 ， 是 一 种 理性 的 分 析 方 法 。 链 接 热 力图 的 问题 在 于 如 果 页 面 内 不 同位 置 存 在 相 
同 链接 会 导致 同一 链接 在 不 同位 置 的 点 击 数据 归 为 一 致 ， 比 如 页 面 顶部 和 底部 都 有 一 个 指向 首页 的 链接 ， 两 个 链接 的 数据 相同 。 图 4-26 所 示 为 某 网 站 链接 点 击 热力 图 。 
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图 4-26” 菜 网 站 链接 点 击 热 力图 


基于 像素 的 热力 图 反映 了 页 面 内 每 个 点 击 位 置 (任何 位 置 而 不 限于 链接 ) 的 点 击 情况 ， 像 素 热 力图 相 比 于 链接 热力 图 更 容易 发 现 非 链接 用 户 的 点 击 习 惯 ， 如 用 户 习惯 性 的 点 击 位 置 、 特 殊 页 面 位 置 喜 好 
等 。 像 素 热力 图 对 于 新 广告 资源 的 挖掘 、 用 户 喜 好 和 习惯 分 析 、 网 页 功能 分 析 具 有 重要 的 指导 意义 。 像 素 热力 图 的 缺点 是 只 能 “感性 ”地 看 图 分 析 ， 没 有 直接 数据 支撑 ， 并 且 热力 图 无 法 反应 页 面 内 容 的 变 
化 ， 无 法 分 辨 同 一 位 置 不 同 内 容 的 点 击 数据 。 图 4-27 所 示 为 一 个 像素 热力 图 ， 其 中 点 击 越 集中 的 部 分 颜色 越 红 。 


图 4-27 某 网 站 像素 点 击 热 力图 


大 多 数 热力 图 只 能 通过 手动 截图 的 方式 留存 ， 但 手工 截图 不 仪 复 杂 而 且 和 繁琐 ， 需 要 每 次 都 打开 页 面 然后 截图 。Webtrekk 支 持 系统 自动 截图 功能 ， 即 每 天 系统 能 自动 截取 当天 的 热力 图 ， 无 须 人 工 参 与 。 


A/B 测 试 是 网 站 优化 的 基本 方法 ，A/B 测 试 功能 常见 于 高 级 网 站 的 分 析 系 统 。A/B 测 试 包括 双 变 量 测试 和 多 变量 测试 。Adobe Analytics (Test and Target 是 领 一 套 产 品 ， 需 要 额外 付费 ) 、 
Webtrekk、Google Analytics 都 自 带 A/B 测 试 功能 。 


A/B 测 试 的 功能 设置 不 同 的 系统 有 差异 ， 但 流程 基本 一 致 。 

步骤 一 : 设置 测试 名 称 。 

步骤 二 : 设置 测试 的 原始 网 页 和 优化 网 页 。 

步骤 三 : 测试 参数 调整 ， 包 括 测试 参与 测试 的 流量 、 版 本 的 流量 分 配 原则 (是 否 平均 分 配 ) 、 数 据 测试 时 间 、 置 信 度 闪 值 、 设 置 转 化 目标 (指定 目标 或 事件 ) 、 结 束 后 是 否 直 接应 用 最 优 结果 等 。 
步骤 四 : 原始 网 页 和 测试 页 面部 署 测试 代码 。 


经 过 以 上 四 步 ， 网 站 测试 工作 即 可 自动 运行 ， 待 数据 条 件 满足 后 ， 数 据 报告 中 会 出 现 A/B 测 试 结果 ; 如 果 设 置 了 自动 应 用 ， 最 优 网 页 会 自动 上 线 而 无 需 人 工 参与 。 图 4-28 所 示 为 基本 的 A/B 测 试 配置 。 


名 称 到 试 应 在 叫 一 个 贞 面 上 进行 人 
语 始 页 面 URL Ihttp://w ww .searchmarketingart comitest/iproductiproduct1 .ht 


测试 版 本 1 URL Ihttp://w ww .searchmarketingart.comitest/productiproduct2 ht 


| MRURL | 


每 个 受 音 的 到 荆 短 与 者 中 的 产 1000 
% 之 于 参与 者 所 有 用 户 中 有 多少 比例 应 欧 与 AB 测 1 才 

[90 四 
开始 时 间 人 由 hymm' 
区 042014 | 本 |21 fel] [0% [el 
是 吝 在 测试 顷 尾 自动 局 用 航 佳 受 量 ? 


硬是 周二 


开始 


明 


转化 结果 | ShoppingCart 加 
图 4-28 Webtrekk A/B 测 试 配置 


ia A/B 测 试 是 页 面 设计 和 优化 的 最 佳 实践 方法 ， 多 变量 测试 适用 于 页 面 更 改元 素 较 多 或 由 于 时 间 限 制 无 法 进行 全 面 测试 的 情况 。 


44 本章 小 结 


本 章 介绍 了 网 站 数据 采集 和 配置 的 相关 知识 ， 这 些 知识 是 网 站 分 析 师 的 基本 职业 素质 和 技能 要 求 ， 同 时 也 是 开展 网 站 数据 工作 人 员 的 必 备 知识 。 
.完整 的 网 站 数据 工作 机 制 包括 数据 采集 、 数 据 处 理 和 数据 报告 三 个 部 分 。 


化 ;会 7 


数据 采集 通常 由 网 站 分 析 师 提供 部 署 方案 ， 数 据 处 理 在 数据 规则 的 约束 下 完成 数据 的 跟踪 、 计 算 和 数据 输出 ， 数 据 输出 包括 Web Service、Report API、Excel API、Feed API、DataWatrchouse 等 途径 。 
建议 读者 在 本 章 内 容 的 基础 上 ， 针 对 以 下 问题 做 进一步 的 研究 : 

" 有 哪些 因素 会 影响 网 站 数据 采集 的 准确 性 ? 

. 根据 自身 的 实际 工作 ， 规 划 网 站 外 部 数据 导入 的 范围 及 必要 性 。 


. 登录 网 站 工具 平台 ， 查 看 所 有 配置 是 否 合理 及 需要 如 何 改进 。 


第 5 章 ”网 站 分 析 工 具 的 选择 


“ 工 欲 善 其 事 必 先 利 其 器 ”， 网 站 分 析 工 具 是 网 站 数据 分 析 师 良好 工作 产 出 的 基础 。 国 内 就 有 非常 多 的 网 站 分 析 工 具 可 供 选 择 ， 面 对 林林总总 的 工具 ， 很 多 企业 和 个 人 感 党 无所适从。 不 同 的 网 站 分 析 
工具 有 哪些 差异 ”企业 应 该 如 何 甄别 不 同 的 服务 商 ， 选 择 一 款 适 合 自身 需求 的 网 站 分 析 工 具 ” 本 章 将 围绕 这 些 话题 进行 探讨 。 


5.1 ”网 站 分 析 工 具 


网 站 分 析 的 起 源 要 追溯 到 20 世 纪 90 年 代 初 期 ， 人 们 为 了 更 好 的 统计 服务 器 被 请 求 的 情况 而 开发 出 基于 日 志 的 网 站 分 析 工 具 ，AWStats、Analog、Webalizer 都 是 网 站 分 析 初 期 免费 工具 的 典型 代表 ， 它 
们 已 经 可 以 实现 的 基本 维度 包括 时 间 、 地 域 、 浏 览 器 、 反 向 链接 、 搜 索 词 等 ， 指 标 也 已 经 涵盖 了 IP 数 、Session 数 、 浏 览 量 、 请 求 量 等 。 这 些 工具 处 于 网 站 分 析 工 具 发 展 的 早期 ， 很 多 功能 还 不 完善 ， 图 5-1 
所 示 为 AWStats 工 具 界面 的 一 部 分 。 
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图 5-1 AWStats 界 面 
在 随后 的 时 间 里 ， 网 站 分 析 工 具 的 发 展 日 新 月 异 ， 很 多 网 站 的 分 析 工 具 相 继 诞 生 ， 部 分 工具 已 经 成 为 网 站 分 析 领 域 的 巨 壁 ， 如 图 5-2 所 示 。 
1993 年 ， 第 一 款 商 用 的 网 站 分 析 工 具 诞 生 一 一 Webtrends， 传 统 意义 上 我 们 认为 Webtrends 是 网 站 分 析 工 具 的 鼻祖 ， 它 是 基于 日 志 的 网 站 分 析 系 统 。 
1995 年 ， 同 样 基于 日 志 分 析 的 Urchin 诞 生 (Urchin 对 于 Google Anaytis 具 有 重要 意义 ， 后 面 章节 会 详细 介绍 ) 。 


1996 年 ，Omniture (Sitecatalyst) 诞生 ， 值 得 注意 的 是 它 是 基于 SAAS 模 式 (早期 称 为 ASP，Application Service Provider 即 应 用 服务 提供 商 ) 的 软件 ， 它 开创 了 SAAS 服 务 的 先河 ， 在 此 之 后 的 大 型 
商用 网 站 分 析 工 具 基 本 都 以 SAAS 模 式 为 主 。 


1999 年 ，Coremetrics 诞 生 。 

2003 年 ，Webtrekk 诞 生 ，Webtrekk 的 诞生 标志 着 欧洲 网 站 分 析 工 具 正式 进入 大 规模 的 发 展 阶段 ， 截 至 目前 ，Webtrekk 已 经 成 为 欧洲 最 大 的 付费 网 站 分 析 解 决 方案 提供 商 。 

2005 年 ，Google 收 购 Urchin， 同 时 推出 了 Google Anaytics， 从 此 Google Urchin 和 Google Analytics 并 行 发 展 ， 现 在 Google Analytics 已 经 成 为 世界 上 应 用 最 广泛 的 免费 网 站 分 析 工 具 。 
2009 年 ，Adobe 以 18 亿 美元 收购 Omniture， 在 随后 的 时 间 里 ，Omniture 发 展 成 为 世界 级 付费 网 站 分 析 解 决 方案 提供 商 ， 拥 有 世界 一 流 的 技术 实力 。 

2010 年 ，IBM 收 购 Coremetrics。 

2011 年 ，Google 推 出 Google Analytics Premium (简称 GAP) ，GAP 是 Google Analytics 的 付费 版 ; 同年 ，Google Analytics 的 升级 版 本 Universal Analytics 开 始 公开 测试 。 

2012 年 ，Google 终 止 Urchin 服 务 ，Urchin 退 出 历史 舞台 。 


2013 年 ，Adobe 重 组 Adobe Marketing Cloud 产 品 线 ， 同 时 将 Omniture 整 合 到 Adobe Anaytics， 成 为 Adobe Marketing Cloud 中 的 一 部 分 。 


网 站 分 析 工 具 的 发 展 历 程 
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图 5-2 ”网 站 分 析 工 具 的 发 展 历程 
5.1.1 Adobe Analytics 


1. 工 具 简 介 


2013 年 7 月 ，Adobe 对 旗下 在 线 数 据 领 域 的 产品 进行 重组 ， 并 将 Omniture 相 关 功 能 模块 打包 进 Adobe Analytics， 成 为 Adobe Marketing Cloud 的 一 部 分 ( 除 Adobe Analytics 外 还 包括 Adobe 
Campaign、Adobe Social、Adobe Media Optimizer、Adobe Target 和 Adobe Experience Manager) 。Adobe Marketing Cloud 的 产品 组 成 ， 如 图 5-3 所 示 。 


Adobe Marketing Cloud 


Campaign ， 
Experience Media 
Manager Optimizer 
图 5-3 ”Adobe Marketing Cloud 的 产品 组 成 


重组 之 后 的 Adobe Analytics 功 能 空前 完善 ， 除 了 有 具备 原 有 的 Sitecatalyst (重组 后 改名 为 Marketing reports and analytics) 外 ， 还 覆盖 了 数据 集成 服务 、 本 地 网 站 分 析 解 决 方案 、 数 据 仓库 、 标 签 管 
理 器 等 网 站 分 析 数 据 工 作 的 上 下 游 产 品 。 同 时 ，Adobe Analytics 通 过 与 Marketing Cloud 中 的 其 他 产品 整合 ， 拓 展 了 网 站 数据 与 业务 结合 的 领域 ， 包 括 测试 优化 、 推 荐 、 搜 索 、 媒 介 管理 、 网 站 管理 等 业 
务 模块 。 


Adobe Analytics 采 用 SAAsS 服 务 模式 ， 监 测 学 畴 覆盖 Web/WAP/APP。 基 于 强大 的 整合 能 力 和 先进 的 技术 水 平 ，Adobe Analytics 在 世界 范围 内 保持 付费 网 站 分 析 解 决 方案 的 领先 地 位 。 
2. 产 品 组 成 


Adobe Analytics 产 品 包括 Marketing Reports&Analytics (市 场 营 销 报 告 与 分 析 ) 、Ad hoc analysis (临时 分 析 ) 、Data workbench (数据 工作 台 ) 、Data Connectors (数据 连接 器 ) 、Data 
warehouse (数据 仓库 ) 、Tag management (标签 管理 ) 、Report builder (报表 生成 器 ， 适 用 于 Excel) 、Visitor click map (访客 点 击 图 ) 。 表 5-1 列 出 Adobe Analytics 新 旧 产 品 对 应 的 名 称 和 功 
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表 5-1 Adobe Analytics 新 旧 产 品 对 应 的 名 称 和 功能 


旧 产 品名 新 功能 
SiteCatalyst 市 场 营 销 报 告 与 分 析 (Marketing Reports & Analytics) 
Discover 一 分 析 (Adhoc analysis) 
Insight 5 工作 台 【〈Data workbench ) 
Genesis 本 E 接 天 (Data Connectors) 
DataWarehouse 数据 仓库 (Data warehouse) 
TagManager 标签 管理 (Tag management) 
ReportBuilder 报表 生成 带 ， 人造 用 于 Excel (Report builder) 
ClickMap 访客 点 击 图 (Visitor click map) 


(1) Marketing Reports&Analytics 


Marketing Reports&Analytics 是 Adobe Analytics 网 站 分 析 最 重要 的 组 件 ， 也 是 数据 收集 、 报 表 展 现 、 分 析 、 管 理 的 平台 。 它 是 通过 在 线形 式 直 接 访 问 的 ， 可 进行 在 线 报表 分 析 和 挖掘 网 站 数据 。 图 5- 
4 所 示 为 Marketing Reports&Analytics 的 信息 界面 。 
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图 5-4 ”Matketing Reports&Analytics 信 息 界 面 
Marketing Reports&Analytics 信 息 界面 由 以 下 六 部 分 组 成 。 
` 报表 与 管理 功能 切换 区 域 : 如 图 中 四 所 示 ， 点 击 星 型 图 标 即 可 切换 到 管理 员 菜 单 。 
. 常用 功能 区 域 : 如 图 中 加 所 示 ， 其 功能 包括 下 载 、 发 送 、 打 印 、 加 入 功能 板 (Dashboard) 、 预 警 、 提 取 数 据 、 计 划 提 交 、 创 建 书签 、 局 动 临时 分 析 等 。 
. 报表 进入 区 域 : 如 图 中 (加 所 示 ， 点 击 标题 即 可 进入 相应 的 报表 。 
“ 主 菜单 区 域 : 如 图 中 国 所 示 ， 报 表 分 析 的 入 口 ， 该 菜单 可 自 定 义 。 
:图形 展示 区 域 : 如 图 中 全) 所 示 ， 所 有 的 报表 都 可 以 用 图 形 展示 。 
. 报表 数据 区 域 : 如 图 中 (@) 所 示 ， 报 表 区 域 显 示 维 度 和 指标 值 。 
Marketing Reports&Analytics 报 表 功 能 完善 ， 履 盖 了 所 有 Web/WAP/APP 数 据 维度 ， 具 体 功 能 列表 如 下 。 


1) 常规 网 站 分 析 维 度 : 包括 网 站 汇总 数据 、 来 源 渠 道 数据 ( 自 定义 广告 媒介 、 免 费 搜索 和 付费 搜索 、 引 荐 来 源 、 来 源 路 径 ) 、 网 站 内 容 数据 (网 站 所 有 页 面 、 进 入 页 面 、 退 出 页 、 页 面 或 内 容 组 路 
径 ) 、 用 户 数据 (地 域 、 新 老 访客 、 含 WAP 在 内 的 来 源 设 备 分 类 及 具体 设备 信息 、 客 户 忠诚 度 、 购 买 回访 等 ) 。 


2) 自 定 义 网 站 分 析 维度 : 漏斗 分 析 、 路 径 分 析 、 和 营销 渠道 分 析 、 内 容 组 分 析 (渠道 分 组 、 内 容 分 组 、 产 品 分 组 、 用 户 分 组 ) 、 电 子 商 务 转 化 分 析 (产品 浏览 、 加 入 购物 车 、 结 算 、 提 交 订 单 ) 及 其 他 自 
定义 维度 。 


3) APP 应 用 分 析 : 在 之 前 的 版 本 中 ，Adobe Analytics 仍 然 沿 用 Web 的 分 析 思 路 提供 针对 APP 应 用 分 析 的 解决 方案 ; 2013 年 4 月 18 日 以 后 ，Adobe Analytics 提 供 了 针对 APP 特 性 的 专用 维度 和 度量 ， 
如 图 5-5 所 示 。 
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图 5-5 ”Marketing Reports&Analytics 中 的 移动 应 用 报表 


“ 地 理 防护 和 兴趣 点 (POI) : 以 给 定 的 半径 ， 通 过 经 纬度 定义 兴趣 点 ， 用 于 按 位 置 划分 区 段 ， 为 移动 应 用 程序 提供 更 准确 的 基于 位 置 的 营销 。 
存留 期 值 : 确定 增加 应 用 程序 用 户 值 的 关键 活动 ， 然 后 基于 该 值 进行 测量 和 定位 。 

" 定时 事件 : 测量 和 报告 用 户 完 成 关键 事件 所 花费 的 时 间 ， 包 括 应 用 程序 内 时 间 和 总 体 时 间 。 

' 应 用 程序 生命 周期 量度 : 包括 安装 、 升 级 、 启 动 、 崩 江 等 APP 特 有 度量 。 


“ 在 Analytics 和 Target 之 间 实 现 生命 周期 、POI 和 存留 期 值 数据 的 无 颖 工作 流 。 


4) 异常 检测 分 析 : 异常 检测 是 Adobe Analytics 独 有 的 利用 数据 挖 握 算法 呈现 的 数据 分 析 报 表 ， 用 来 做 异常 数据 监测 。 关 于 异常 检测 的 具体 信息 ， 详 见 4.3.2 中 的 “异常 检测 模型 配置 ”。 


5) 特殊 网 站 分 析 维 度 : 如 果 使 用 其 他 Adobe Markting Cloud 产 品 ，Adobe Analytics 同 样 可 以 整合 其 数据 ， 如 Adobe Target 的 Target 数 据 、Recommendation 中 各 个 推荐 位 置 点 击 数 据 (具体 取决 
于 部 署 情况 ) 、Adobe Survey 数 据 等 。 


以 下 是 对 Marketing Reports&Analytics 功 能 列表 的 几 点 重要 说 明 。 


1) 下 钻 层 次 : 几乎 所 有 数据 报表 都 支持 下 钼 ， 但 只 支持 一 层 下 钻 。 


2) 关联 报表 : Marketing Reports&Analytics 也 有 关联 报表 ， 即 购买 了 某 产品 的 用 户 还 购买 了 哪些 产品 。 但 其 关联 报表 仪 限于 购买 产品 的 关联 ， 且 数据 结果 不 是 基于 数据 挖掘 的 关联 模型 ， 而 是 基于 用 
户 在 一 次 购买 时 通常 一 起 购买 哪些 商品 的 统计 性 报表 ， 该 报表 通过 商品 关联 报表 下 钻 进行 查看 。 


3) 实时 报表 : Marketing Reports&Analytics 中 的 实时 报表 由 两 部 分 组 成 。 


实例 ， 


第 一 部 分 是 单独 的 Realtime Report: 该 报表 允许 使 用 一 个 网 站 范围 的 量度 ， 为 每 个 报表 添加 3 个 维度 或 分 类 (1 个 主要 维度 ， 两 个 次 要 维度 ) ; Realtime Report 支 持 使 用 任何 自 定义 事件 、 购 物 车 事件 或 
查看 至 多 两 小 时 的 历史 实时 数据 ， 该 报表 以 秒 更 新 ， 如 图 5-6 所 示 。 


. 第 二 部 分 是 各 个 报表 中 的 实时 功能 : Adobe Analytics 在 细 分 类 报表 中 都 提供 了 “Include Current Data” 功 能 ， 它 允许 将 接近 实时 的 数据 应 用 到 报表 内 做 统计 分 析 。 不 同 的 指标 数据 实时 性 有 所 差 


异 ，PV、 实 例 数 等 单 次 计数 类 指标 延迟 时 间 为 10 分 钟 以 内 ; 订单 、 收 入 等 指标 延迟 在 10~25 分 钟 ; UV、YVisit 延 迟 在 45~120 分 钟 。 
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图 5-6 Adobe Analytics 的 实时 报表 
Marketing Reports&Analytics 指 标 列表 如 下 。 


1) 常规 流量 指标 : UV (每 小 时 UV、 每 日 UV、 每 周 UV、 每 季度 UV 等 ) 、Visit、 页 面 查 看 (PV) 、 访 问 深度 、 停 留 时 间 、 跳 出 及 跳出 率 、 退 出 及 退出 率 、 新 老 访客 比 等 。 


2) 特殊 流量 指标 : 点 进 次 数 、 实 例 数 、 产 品 查 看 、 单 次 存 取 。 
3) 常规 转化 指标 : 购物 车 加 货 、 购 物 车 打开 、 购 物 车 减 贷 、 购 物 车 查看 、 结 账 、 订 购 。 


4) 特殊 转化 指标 : 提 及 次 数 、 参 与 率 及 其 他 自 定 义 指标 和 事件 等 。 
天 于 几 个 特殊 指标 的 说 明 如 下 。 


1) 点 进 次 数 : 点 进 次 数 表示 特定 促销 活动 的 跟踪 代码 被 传递 到 报表 中 的 次 数 ， 技 术 上 的 触发 逻辑 是 ， 当 用 户 从 站 外 标记 广告 进入 网 站 后 ， 每 次 进入 都 会 计算 为 一 次 点 进 ， 因 此 概念 类 似 于 广告 落地 页 的 
到 达 数 。 该 指标 用 来 计算 到 达 率 ， 公 式 为 站 内 点 进 次 数 / 站 外 点 击 次 数 ， 到 达 率 是 衡量 广告 活动 流量 质量 的 重要 指标 。 


2) 实例 数 : 实例 是 指 某 个 定义 的 变量 被 触发 的 次 数 ， 逻 辑 上 类 似 于 PV， 每 点 击 一 次 记录 一 次 。 它 与 PV 的 区 别 在 于 PV 只 用 来 衡量 页 面 效果 ， 实 例 则 可 以 衡量 所 有 页 面 、 动 作 、 事 件 等 元 素 的 触发 次 数 。 
3) 产品 查看 : 产品 查看 与 页 面 查看 不 同 ， 产 品 查看 指 的 是 有 产品 ID 跟踪 页 面 的 页 面 浏览 量 ， 而 页 面 查看 仅 针对 某 个 页 面 的 浏览 量 。 


合 尘 总 在 电子 商务 跟踪 中 ， 不 只 是 产品 终端 页 才 有 产品 ID 跟 踪 ， 购 物 车 流程 页 也 有 。 因 此 大 多 数 情 况 下 产品 查看 不 等 于 产品 页 的 页 面 查 看 。 以 图 5-7 为 例 : 用 户 浏览 了 产品 A 一 次 ， 然 后 将 该 产品 加 入 
购物 车 并 提交 订单 。 那 么 对 产品 A 而 言 ， 页 面 查看 是 1 (产品 A 页 面 只 浏览 了 一 次 ) ， 产 品 查 看 是 3 (三 个 页 面 都 有 产品 A 跟踪 ， 对 于 该 产品 A 触发 了 3 次 ) 。 


4) 单 次 存 取 : 单 次 存 取 由 网 站 唯一 的 页 面 名 称 值 定义 。 如 果 用 户 进 入 网 站 后 并 点 击 跟踪 链接 、 触 发 了 事件 (例如 视频 查看 ) 或 重新 载 入 页 面 ， 则 访问 仍 会 被 视 为 一 次 单 次 存 取 。 只 要 PageName 变 量 
值 没有 更 改 ， 就 可 以 发 送 任意 次 请 求 ， 并 且 访 问 仍然 会 被 视 为 一 次 单 次 存 取 。 因 此 单 次 存 取 的 意思 是 Single Page ( 单 页 面 ) 。 


5) 参与 率 : 参与 率 是 订单 归 因 模型 的 应 用 指标 ， 用 来 衡量 一 个 成 功 转化 事件 如 何在 不 同 对 象 间 分 配 ， 参 与 率 是 站 内 所 有 业务 对 象 的 重要 参考 指标 ， 代 表 了 其 在 用 户 转化 过 程 中 的 作用 。 参 与 率 的 分 配 权 
重 根据 配置 而 定 ， 可 选 值 为 首 个 、 最 近 、 线 性 。 
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图 5-7 产品 查看 与 产品 页 的 页 面 查看 的 区 别 
举例 ， 假 如 用 户 先 搜索 了 一 个 “电脑 ”， 然 后 又 搜索 了 一 个 “苹果 电脑 ”并 下 单 完 成 100 元 交易 ， 不 同 分 配 模型 下 两 个 关键 字 的 参与 率 如 下 。 
“ 首 个 : 电脑 获得 100 元 贡献 ， 苹果 电脑 贡献 为 0 元 ，; 
" 最 近 : 电脑 获得 0 元 贡献 ， 苹 果 电 脑 贡献 为 100 元 ; 
* 线性 : 电脑 获得 50 元 贡献 ， 革 有 果 电 脑 贡献 为 50 元 。 
(2) Ad hoc analysis 


Ad hoc analysis， 它 的 应 用 场景 就 如 它 的 中 文 名 称 一 样 一 一 用 来 做 临时 分 析 。Ad hoc analysis 是 Adobe Analytics 组 件 中 除 Data Workbench 外 做 深入 挖掘 最 强大 的 工具 ， 它 的 使 用 对 象 是 具有 丰富 经 
验 的 网 站 数据 分 析 师 。 


Ad hoc analysis 也 有 预 置 报表 模板 ， 相 比 于 Marketing Reports&Analytics， 它 在 前 期 无 须 任何 数据 配置 和 定义 ， 只 在 用 到 时 启用 即 可 ， 其 包括 : 自 定义 指标 、 区 段 (高 级 细 分 ) 、 漏 斗 、 路 径 、 报 表 
维度 和 指标 、 时 间 粒 度 等 。 


Ad hoc analysis 界 面 ， 如 图 5-8 所 示 。 整 个 工作 区 可 分 为 三 大 区 域 : 


. 行 和 列 的 选择 区 域 : 该 区 域 包 括 所 有 的 量度 、 维 度 、 区 段 配置 。 区 别 于 其 他 所 有 网 站 的 分 析 工 具 ， 在 Ad hoc analysis 中 量度 和 维度 没有 固定 的 行 和 列 的 限制 ， 即 在 一 块 画 布 中 ， 可 以 任意 把 维度 或 指标 
拖 负 到 想 要 的 行 或 列 中 ， 如 图 5-8 中 四 所 示 。 


. 细 分 和 筛选 区 域 : 该 区 域 可 以 进行 数据 筛选 和 过 滤 ， 如 图 5-8 中 加 所 示 。 


: 画布 主体 区 域 : 该 区 域 显示 要 分 析 的 对 象 ， 包 括 表 格 数 据 、 流 程 数 据 、 路 径 数 据 、 网 站 分 析 、 流 量 和 虚拟 焦点 等 ， 如 图 5-8 中 (加 所 示 。 
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图 5-8 Ad hoc analysis 界 面 


几乎 所 有 的 Marketing Reports&Analytics 的 维度 和 指标 都 可 以 应 用 到 Ad hoc analysis 中 ， 除 了 任意 拖 灸 维度 和 指标 ，Ad hoc analysis 在 可 用 维度 、 区 段 过 滤 和 分 析 能 力 上 拓展 了 网 站 分 析 能 力 的 极 
限 。 


1) 更 灵活 的 分 析 对 象 一 一 报表 


.三维 图 形 : Marketing Reports&Analytics 中 的 表格 和 图 形 只 支持 二 维 图 形 ， 在 Ad hoc analysis 中 支持 三 维 图 形 ， 三 维 图 形 意 味 着 有 更 多 的 维度 可 同时 分 析 对 象 及 对 象 间 的 效果 。 如 第 4.3.2 节 路 径 功能 配置 
中 Discovet 三 维 路 径 图 。 


* 流失 报表 : 流失 报表 与 漏斗 报表 的 功能 类 似 ， 可 以 混合 使 用 所 有 的 分 析 维 度 分 析 用 户 在 一 系列 步骤 之 间 的 流失 和 转化 情况 ， 如 图 5-9 所 示 。 


11.454 访问 上 成功 总 数 0 


5 .993 访问 严 52.32% B00 


有 四 


和 滞 加 购物 车 商品 件数 ( 事件 54 ) 1,005 访问 A 
:ml:s 
Checkouts 450 访问 A 
= 本 
284 访问 2.48% 63.11% B00 


图 5-9 流失 报表 
" 鹿 拟 焦点 组 报表 : 虚拟 焦点 图 通过 图 形 再 现 了 网 站 上 访客 的 访问 量 ， 包 括 在 页 面 上 的 停留 时 间 和 其 他 数据 。 虚 拟 焦 点 组 报表 从 访问 中 随机 抽取 一 个 访问 ， 然 后 显示 有 关 该 访问 的 详细 数据 ， 并 可 以 使 
用 该 报表 从 访客 群体 中 创建 焦点 组 。 图 5-10 所 示 为 虚拟 焦点 图 。 
图 保存 ”各 新 访问 
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图 5-10 ”虚拟 焦点 图 
2) 更 深入 的 数据 筛选 一 一 区 段 


传统 的 区 段 或 高 级 细 分 只 能 根据 维度 和 事件 进行 过 滤 ， 无 法 将 时 间 序 列 作 为 过 滤 条 件 ， 比 如 可 以 筛选 访问 了 A 页 面 又 访问 了 B 页 面 的 流量 ,但 是 无 法 确认 A 和 和 B 的 发 生 顺 序 及 发 生 时 间 。Ad hoc analysis 
可 将 区 段 功能 做 到 极致 ， 其 允许 通过 复杂 的 时 间 逻 辑 定义 区 段 。 


* 简单 的 访客 序列 : 简单 的 访客 序列 是 指 访客 在 点 击 查看 特定 页 面 之 后 又 查看 了 另 一 个 页 面 ， 两 个 页 面 之 间 只 考虑 先后 关系 ， 而 不 考虑 访问 次 数 或 频率 。 简 单 的 访客 序列 的 时 间 定 义 属 于 点 击 级 别 ， 即 
每 个 点 击 都 为 独立 的 个 体 区 间 。 图 5-11 所 示 为 定义 一 个 用 户 先 访问 A 页 面 然后 访问 B 页 面 的 区 段 。 


THEN lo 


由 加 


图 5-11 简单 的 访客 序列 定义 
定义 该 区 段 后 ，A 一 B 一 C 一 D 和 A 一 C 一 B 的 用 户 路 径 都 能 匹配 该 定义 ， 而 B 一 A 无 法 匹配 。 


“ 跨 访问 的 访客 序列 : 跨 访 问 的 访客 序列 是 指 在 一 次 访问 中 完成 一 个 点 击 ， 然 后 在 另 一 次 访问 中 完成 一 个 点 击 ， 两 个 点 击 之 间 存 在 时 间 序 列 关系 。 与 简单 的 访客 序列 相 比 ， 该 访客 需要 匹配 跨 不 同 访问 
的 点 击 。 图 5-12 所 示 为 定义 一 个 在 不 同 的 访问 中 依次 点 击 页 面 A 和 页 面 B， 并 且 可 以 在 它们 之 间 包 含 额外 的 页 面 查 看 点 击 。 


图 5-12” 跨 访问 的 访客 序列 定义 
定义 该 区 段 后 ， 如 果 A 和 B 处 于 不 同 的 访问 ， 且 发 生 的 先后 关系 为 先 A 后 B， 则 匹配 该 区 段 ; 如 果 A 和 B 发 生 在 同一 个 访问 内 则 无 法 匹配 。 
辐 注 意 该 定义 的 关键 是 首先 定义 一 个 访客 新 容器 ， 然 容器 套 连 续 定义 两 个 访问 级 别 的 容器 ， 两 个 容器 间 的 关系 是 THEN。 


让 售 查 点 : 通过 使 用 混合 容器 区 段 ， 可 以 根据 不 同 的 容器 级 别 细 分 访客 ， 从 而 过 滤 掉 点 击 级 别 的 页 面 查看 ， 但 需要 保留 访问 级 别 的 其 他 页 面 查看 。 图 5-13 所 示 为 定义 了 一 个 用 户 在 不 确定 数量 
两 个 页 面 ， 但 在 不 同 的 访问 中 查看 了 C 页 面 。 


定义 该 区 段 后 ， 用 户 可 以 在 相同 或 不 同 的 访问 中 访问 页 面 A 和 B， 但 C 页 面 的 访问 必须 与 A 和 B 的 任何 一 方 不 在 同一 个 访问 区 间 内 。 
人 OO 沪 该 定义 的 关键 是 首先 定义 A 和 B 处 于 一 个 访客 容器 ，C 处 于 父 容 器 内 。 


\: 通过 使 用 聚合 检查 点 区 段 ， 可 以 添加 多 个 点 击 级 别 的 容器 ， 并 在 相同 类 型 的 容器 之 间 使 用 相应 的 运算 符 来 定义 规则 和 维度 (如 页 数 和 访问 次 数 ) 。 图 5-14 所 示 为 定义 了 一 个 在 页 面 查看 


次 ) 之 后 点 击 的 页 面 是 A， 然 后 访问 页 面 B 或 页 面 C， 其 与 访问 数 无 关 。 


AND 


访问 数 别 


THEN |@ | 本 | 
会 容器 标题 


由 加 


图 5-14 聚合 检查 点 定义 
定义 该 区 段 后 ， 由 于 访问 次 数 维 度 的 约束 ， 页 面 A 需要 至 少 为 第 二 个 页 面 查 看 。 然 后 ， 必 须 在 相同 或 随后 的 访问 中 查看 页 面 B 或 页 面 C， 其 与 访问 数 无 关 。 


` 谋 套 顺序 区 段 : 谋 套 顺序 区 段 通 过 在 一 个 顺序 区 段 中 谋 套 男 一 个 顺序 区 段 ， 可 以 连接 不 同 层 的 容器 ， 并 执行 规则 以 生成 复杂 的 顺序 区 段 。 通 过 在 访问 和 点 击 级 别 放置 检查 点 ， 可 以 限制 区 段 以 满足 特 
定 访问 以 及 特定 点 击 中 的 要 求 。 图 5-15 所 示 为 访客 访问 页 面 A， 然 后 在 同一 访问 中 访问 页 面 B; 接 下 来 ， 访 客 在 新 的 访问 中 访问 页 面 C。 


THEN Io ol| 


内 加 


THEN I 


< 容器 标题 


负面 


图 5-15 ”时 套 顺 序 区 段 定 义 
定义 该 区 段 后 ， 页 面 A 和 B 的 页 面 查看 点 击 必须 位 于 相同 的 访问 中 ， 而 页 面 C 访 问 必须 作为 单个 页 面 查 看 位 于 该 访问 之 外 。 如 果 在 访问 或 点 击 (页 面 查看 ) 容器 中 找到 ， 则 与 页 面 C 匹 配 。 


* 排除 检查 点 : 可 通过 禁止 将 容器 作为 顺序 区 段 的 一 部 分 ， 强 制 进 行 反 向 匹配 。 排 除 检查 点 支持 排除 检查 点 之 间 、 序 列 开头 排除 和 序列 末尾 排除 三 种 方法 。 图 5-16 所 示 为 使 用 “排除 检查 点 之 间 ” 的 规 


则 定义 一 个 聚合 区 段 ， 其 中 将 三 个 点 击 容器 拖 到 画布 中 ， 分 配 THEN 运 工 符 以 连接 容器 逻辑 ， 然 后 排除 中 间 的 页 面 查 看 容器 仅 以 包含 从 序列 中 的 页 面 A 访 问 页 面 C 的 访客 。 
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图 5-16 ”排除 检查 点 定义 
定义 该 区 段 后 ,访客 从 页 面 A 访 问 页 面 C 的 过 程 中 ， 必 须要 跳 过 页 面 B 才 能 匹配 区 段 。 


" 逻辑 组 检查 点 : 逻辑 组 提供 了 一 种 方法 ， 将 顺序 区 段 中 的 几 个 检查 点 指定 为 一 个 组 ， 然 后 针对 该 组 匹配 规则 ， 而 不 需要 在 访客 一 访问 一 点 击 层 次 结构 中 对 这 些 检 查 点 进行 排序 。 还 辑 检查 点 支持 采用 
任意 顺序 的 遇 辑 组 检查 点 、 还 辑 组 第 一 个 匹配 、 逻 辑 组 排除 AND、 逻 辑 组 排除 OR。 


` 区 段 内 和 之 后 的 时 间 : 这 是 通过 检查 点 之 间 的 特定 持续 时 间 、 粒 度 和 计数 限制 的 匹配 ， 可 以 使 用 每 个 容器 标题 中 内 置 的 Within 和 Aftef 运 前 符 定义 时 间 、 事 件 和 计数 。 同 时 ， 可 以 使 用 Within 和 Aftef 容 器 
并 指定 粒度 和 计数 ， 以 将 匹配 限制 为 指定 的 持续 时 间 。Within 运 萌 符 用 于 指定 两 个 检查 点 之 间 的 时 间 长 度 的 最 大 限制 ; After 运算 符 用 于 指定 两 个 检查 点 之 间 的 时 间 长 度 的 最 小 限制 。 图 5-17 所 示 为 Afterf 和 


Within 运 算 符 一 起 使 用 以 定义 顺序 区 段 : 访客 访问 页 面 A， 然 后 在 两 周到 一 个 月 内 访问 页 面 B。 


图 5-17 区 段 内 和 之 后 的 时 间 定 义 


. 区 段 之 间 的 访问 : 可 以 使 用 Within 和 Aftet 运 算 符 根据 访问 次 数 在 区 段 间 确定 访客 ， 根 据 容 器 之 间 存 在 的 访问 来 限制 匹配 ， 以 便 计 入 事件 而 不 是 通过 时 间 计 量 来 进行 限制 。 图 5-18 所 示 为 使 用 区 段 之 间 的 


访问 定义 在 访问 了 页 面 A 之 后 ， 在 第 三 次 访问 页 面 B。 


图 5-18 使 用 “区 段 之 间 的 访问 ”规则 定义 区 段 
3) 无 穷 的 数据 挖掘 能 分 析 


-无限 路 径 : Ad hoc analysis 中 的 无 限 路 径 报表 叫做 网 站 分 析 报 表 。 它 通过 图 形 显示 整个 网 站 的 用 户 在 不 同 对 象 间 的 行为 流 ， 对 象 的 衡量 指标 可 以 任意 选择 。 对 路 径 中 的 每 个 对 象 ， 都 支持 鼠标 任意 拖 名 
和 拓展 。 其 中 的 路 径 可 以 无 限 延 伸 ， 当 鼠标 移动 到 对 象 上 时 还 可 以 显示 相关 指标 ， 如 图 5-19 所 示 。 


: 无限 下 钻 : 受 数据 计算 能 力 的 限制 ， 没 有 一 个 工具 能 实现 无 限 下 钻 ， 原 因 是 每 个 数据 指标 下 钻 时 的 数据 计算 量 呈 指数 增长 ， 很 少 有 系统 工具 可 以 支持 如 此 巨大 的 数据 计算 量 。 但 在 Ad hoc analysis 中 ， 


无 限 下 钻 的 功能 实现 了 ， 如 图 5-20 所 示 。 
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图 5-19 Adhoc analysis 网 站 分 析 报 表 


查看 0 局 /页 面 


图 5-20 Adhoc analysis 无 限 下 钻 功 能 


+ 受 计算 和 请 求 量 的 限制 ，Ad hoc analysis 的 账号 数量 非常 少 ， 且 不 支持 同时 在 线 ， 如 公司 有 一 个 账户 ， 同 一 时 间 只 能 一 个 人 使 用 ， 其 他 人 则 需 排 队 等 待 。 通 常 ， 普 通 客户 只 有 一 个 账号 ， 即 使 是 


全 球 性 的 跨国 客户 ， 账 号 数量 都 在 10 个 以 内 ， 这 也 限制 了 其 强大 功能 的 发 挥 。 
(3) Data workbench 


Data workbench， 是 Adobe Analytics 中 数据 挖掘 能 力 最 强 的 产品 。 与 Marketing Reports&Analytics 和 Ad hoc analysis 不 同 的 是 ，Data workbench 侧 重 于 跨 渠道 ( 线 上 线 下 ) 数据 整合 ， 能 将 海量 
数据 集成 到 Data workbench 中 进行 任意 分 析 。 因 此 ， 可 以 把 Data workbench 看 成 是 本 地 版 的 Marketing Reports&Analytics 和 Ad hoc analysis 的 集成 应 用 。 但 Data workbench 的 能 力 不 仅 局 限于 此 ， 
它 还 具有 更 强大 的 数据 可 视 化 和 数据 挖掘 能 
. 本 地 化 。 由 于 Data workbench 是 安装 在 企业 内 部 的 ， 因 此 它 无 须 访问 外 部 网 络 ， 具 有 本 地 和 离线 操作 能 力 ; 同时 ， 处 于 企业 内 部 的 服务 器 在 网 络 访问 效率 、 数 据 集成 可 靠 性 、 数 据 安全 性 等 方面 比 
SAAS 模 式 更 具 优势 。 
* 可视化。 在 线 访 问 受 网 络 传输 的 限制 ， 无 法 提供 三 维 或 更 精美 的 展示 图 表 ， 但 在 本 地 该 问题 迎刃而解 。Data wotkbench 所 有 报表 都 提供 了 同 Ad hoc analysis 一 样 高 水 准 的 可 视 化 报表 ， 很 多 报表 可 通过 三 
维 图 形 展 示 ， 用 户 报表 体验 极 佳 。 如 图 5-21 所 示 为 Data wotkbench 地 域 报 表 ， 通 过 地 球形 式 呈 现 。 
. 数据 挖掘 能 力 。 在 Marketing Reports&Analytics 和 Ad hoc analysis 中 只 应 用 了 异常 检测 报表 ， 其 本 质 是 时 间 序 列 模型 ; 在 Data wotkbench 集 成 了 聚 类 模型 、 关 联 纸 阵 和 评分 三 种 算法 ， 提 供 了 更 多 统计 学 数 
据 的 解读 视角 。 
. 关联 纸 阵 : 关联 算 阵 实际 上 不 属于 数据 挖掘 算法 ， 它 是 一 种 统计 学 方法 ， 用 来 分 析 不 同 变量 间 的 相关 性 关系 。Data Wotkbench 中 的 统计 关联 基于 皮尔 逊 的 关联 模型 ， 该 模型 的 本 质 是 验证 变量 间 的 线 


性 依赖 关系 ， 关 系 强 弱 用 R 值 表示 。R 绝 对 值 大 说 明 变量 间 有 明显 的 线性 ( 正 向 和 负 向 ) 关系 ; 及 绝对 值 小 说 明 两 者 不 具有 明显 的 线性 关系 ， 但 也 不 能 断定 两 者 的 相关 性 弱 ， 可 能 存在 曲线 相关 的 现象 。 相 关 
性 演示 数据 ， 如 表 5-2 所 示 。 通 过 模 轴 和 纵 轴 交 又 确定 两 个 变量 间 的 相关 程度 ， 如 访客 与 转化 率 相 关 性 为 0.503、 新 访客 率 与 跳出 率 相 关 性 为 0.278。 


纬度 +35.295750 
经 度 -93.760227 


图 5-21 Data wotkbench 的 地 域 报告 
表 5-2 相关 性 演示 数据 


页 面 曝光 数 Pearson 相关 性 
显著 性 ( 双 侧 ) 0.227 
N 全 

访客 Pearson 相关 性 0.503 
显著 性 ( 双 侧 ) 0.249 
N 1 

时 长 Pearson 相关 性 0.600 


显著 性 【双人 刷 ) 
N 

新 访客 对 Pearson 相关 性 
显著 性 ( 双 侧 ) 
N 

嘴 出 率 Pearson 相关 性 
显著 性 ( 双 侧 ) 


N 

转化 率 Pearson 相关 性 
显著 性 ( 双 侧 ) 
N 


OO: 蕊 ”相关 性 大 小 要 看 R 的 绝对 值 ， 在 数学 中 表示 为 |R|。R 的 绝对 值 越 大 ， 证明 线性 相关 性 越 强 ， 其 最 大 为 1， 最 小 为 0。 


. 聚 类 : 通过 访客 聚 类 ， 可 以 利用 客户 特性 对 访客 进行 动态 分 类 ， 并 基于 选 定 的 数据 输入 生成 聚 类 集 ， 从 而 识别 具有 相似 兴趣 和 行为 的 群 组 ， 以 便 进 行 客户 分 析 和 定位 。Data workbench 的 聚 类 使 用 的 
是 KK-Means 算 法 ， 聚 类 分 析 结 构 如 图 5-22 所 示 。 


访问 次 网 j 问 《小 时 ) 
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Usted R Square 1 


hd ju 
0 
有 效 观 办 人 dt6 


图 5-22 ”Data wotkbench 聚 类 结果 


评分: 通过 倾向 评分 ， 针 对 每 个 访客 计算 的 评分 表示 指定 事件 (由 目标 过 滤器 定义 ) 可 能 发 生 的 估计 概率 。 因 此 ， 评 分 值 的 范围 介 于 0%~100% 之 间 。 该 模型 常用 于 执行 某 个 流程 或 发 起 某 项 促销 活 
千 合 增 


动 之 前 ， 益 图 和 提升 图 预 估 可 能 产生 的 业务 结果 ， 图 5-23 为 Data workbench 倾 向 评分 模型 。 


Ce 因 变 量 
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图 5-23 ”Data wotkbench 倾 向 评分 模型 


数据 集成 能 力 。SAAS 模 式 的 网 站 分 析 工 具 在 数据 集成 上 的 问题 在 于 云端 服务 器 与 本 地 服务 器 需要 通过 互联 网 进行 数据 沟通 ， 互 联网 传输 的 效率 、 稳 定性 、 可 靠 性 等 因素 成 为 钵 颈 ， 因 此 SAAS 模 式 的 网 
站 工具 很 难 接收 海量 的 外 部 数据 ， 并 把 网 站 分 析 工 具 当 做 企业 数据 仓库 使 用 ， 外 部 数据 只 能 作为 网 站 流量 数据 的 补充 使 用 。 但 在 本 地 模式 的 支持 下 ， 企 业内 部 局 域 网 不 同 服务 器 间 的 数据 交互 更 容易 实现 ， 
摆脱 了 互联 网 的 数据 交互 瓶颈 。 因 此 ，Data workbench 的 数据 整合 能 力 非 常 强大 。 


(4) Data Connectors 


Data Connectors 是 第 三 方 应 用 集成 工具 ， 通 过 该 程序 进行 数据 集成 和 再 营销 ， 其 中 已 经 预 集 成 75 个 认证 合作 伙伴 ,包括 DFA (DoubleClick for Advertisers) 、Facebook、ClickTale、Saleforce.、 
BlueHornet eMarketing Suite 等 。 虽 然 已 经 整合 的 合作 伙伴 涵盖 了 广告 展示 、CRM、EDM、SEM、SEO、 客 户 体 验 、 网 站 性 能 管理 和 监测 等 领域 ， 但 主要 领域 集中 在 EDM、SEO 和 展示 广告 方面 。 


(5) Data Warehouse 


数据 仓库 是 指 用 于 存储 的 、 未 经 处 理 的 原始 数据 副本 ， 以 及 可 通过 过 滤 这 些 数据 而 生成 的 自 定义 报表 。 数 据 仓库 常用 来 导出 结构 化 或 临时 性 报表 ， 由 于 数据 仓库 中 的 数据 缺乏 原始 时 间 戳 ， 导 致 该 报表 
接近 原始 数据 ， 最 小 的 数据 粒度 是 访问 级 别 ， 时 间 粒 度 是 小 时 。 所 以 整体 上 数据 仓库 还 是 经 过 一 定 处 理 后 的 汇总 数据 报表 (将 原始 记录 汇总 成 访问 记录 ) 。 


Data Warehouse 的 用 途 更 多 在 于 海量 数据 导出 ， 由 于 其 单个 文件 数据 容量 不 限 ， 尤 其 适合 导出 以 访问 级 别 为 基础 的 全 量 数据 ， 如 所 有 页 面 数据 、 所 有 产品 数据 等 。 但 Data Warehouse 不 适合 做 复杂 
情况 下 大 量 数据 的 定时 发 送 工作 (虽然 它 有 该 功能 ) 和 集成 工作 ， 原 因 是 定时 工作 配置 系统 不 能 保证 在 配置 的 时 间 点 完成 发 送 ， 最 大 可 能 延迟 72 小 时 ， 基 于 此 规则 的 定时 发 送 缺乏 时 间 保 障 。 


ja 
Data Feed 与 Data Warehouse 


Data Feed 是 Adobe Analytics 的 原始 数据 日 志 ， 日 志 以 结构 化 的 形式 记录 了 每 一 条 请 求 发 生 时 的 所 有 数据 信息 ，Data Feed 是 真正 、 未 加 工 、 以 时 间 稚 为 粒度 的 原始 数据 。Data Feed 每 张 数 据 表 拥有 超过 500 
字段 ( 列 ) ，Feed 最 短 以 小 时 生成 ， 通 常 更 新 频率 是 天 。Data Feed 更 多 的 应 用 于 企业 的 数据 仓库 ， 关 于 Data Feed 的 更 多 知识 将 在 第 6 章 网 站 数据 整合 的 方法 中 进行 具体 介绍 。 


(6) Tag management 


Tag management 包 含 两 部 分 的 组 件 : 一 是 Adobe 自 身 的 Tag Manager; 二 是 新 收购 的 DTM 动 态 标签 管理 器 (Dynamic Tag Manager) 。 标 签 管 理 器 是 用 来 管理 网 站 上 的 Adobe 代 码 和 第 三 方 代码 
的 。Tag Manager 由 于 功能 较 弱 ， 现 在 Adobe 已 经 主推 更 强大 的 DTM 了 ， 在 此 主要 介绍 DTM 动 态 标签 管理 器 。 


DTM 只 对 Adobe Digital Marketing 的 付费 用 户 免费 开放 ， 暂 时 不 对 外 开放 。 目 前 的 DTM 只 支持 JavaScript 触 发 ， 因 此 只 适用 于 Web 网 站 和 HTML ( 含 最 新 的 HTML 5) 开发 的 WAP 网 站 ， 其 对 APP 应 
用 代码 管理 暂时 不 支持 。 


DTM 发 布 流程 包括 创建 规则 、 审 批 和 发 布 三 个 环节 ， 具 体 如 图 5-24 所 示 。 

. 创建 并 保存 规则 。 

. 保存 的 规则 会 被 转 至 批准 队列 中 ， 其 中 可 以 简要 地 查看 规则 的 详细 信息 。 

* 审批 者 、 审 批 者 和 发 布 者 或 管理 员 级 别 的 用 户 批 准 规则 。 

. 规则 进入 发 布 队 列 。 

. 在 发 布 队 列 中 ， 管 理 员 、 发 布 者 或 审批 者 和 发 布 者 级 别 的 用 户 必 须 先 发 布 规则 ， 然 后 规则 才能 变 为 活动 状态 。 


如 果 对 已 发 布 的 规则 进行 更 改 ， 则 这 些 更 改 直到 通过 批准 之 后 才 会 发 布 到 网 站 。 这 可 以 确保 只 有 获得 批准 的 规则 和 规则 修订 才 会 发 布 到 网 站 的 生产 环节 。 此 批准 过 程 还 会 保留 所 有 过 去 和 当前 的 修订 信 
息 。 通 过 保留 的 修订 信息 ， 可 以 轻松 地 追踪 规则 的 历史 记录 ， 并 准确 找 出 问题 可 能 发 生 的 时 间 。 


创建 并 保存 人 批准 规则 批准 后 发 布 
规则 <i 批 We 版 本 生产 


不 会 会 影响 已 己 批 准 的 ni 本 
图 5-24 DTM 发 布 流程 
规则 是 DTM 触 发 的 核心 ，DTM 中 的 代码 只 有 在 满足 特定 规则 的 条 件 下 才能 触发 跟踪 代码 。DTM 中 有 以 下 三 种 类 型 的 规则 。 
. 基于 事件 : 大 多 数目 标 或 用 户 动作 都 可 以 定义 为 一 个 事件 ， 比 如 下 载 、 注 册 等 ， 基 于 事件 的 触发 意味 着 当 事 件 发 生 时 触发 代码 。 
“ 页 面 加 载 : 页 面 加 载 是 在 页 面 加 载 过 程 中 的 触发 ， 页 面 加 载 规则 允许 根据 URL、 网 站 区 域 确定 。 默 认 情 况 下 ， 页 面 加 载 规则 会 在 页 面 底部 加 载 。 
. 直接 调用 : 直接 调用 规则 是 直接 通过 网 站 程序 调用 ， 而 不 需要 特定 场景 。 此 外 ， 它 还 适用 于 动态 标签 管理 在 DOM 中 检测 不 到 事件 的 情况 ， 例 如 与 Adobe Flash 有 关 的 事件 。 
表 5-3 描 述 了 所 有 动态 标签 管理 规则 的 条 件 及 其 功能 

表 5-3 动态 标签 管理 规则 的 条 件 及 其 功能 
条 件 类 型 功 

在 HITP 或 HITPS 中 和 触发 
是 和 否 在 指定 的 子 域 中 触发 
是 否 在 指定 的 URL 足 径 中 触发 
在 存在 具有 特定 但 的 特定 URL 参 效 时 舱 人 发 
Cookie 退出 仅 在 用 户 接受 Cookie 时 健 发 
浏览 请 仅 在 指定 的 浏览 器 中 触发 
操作 系统 仪 在 指定 的 摊 作 系统 中 触发 
设备 类 型 仅 在 指定 的 设备 中 触发 
屏幕 分 辨 率 在 指定 的 屏 估 分 辩 率 学 围 内 稻 发 

在 指定 的 窗口 大 小 范围 内 触发 

在 有 来 自 指定 源 的 访问 时 触发 

在 有 访问 登录 指定 的 页 面 时 触发 

仅 在 有 新 访客 / 回访 访客 时 佣 发 

在 访客 拥 有 大 于 、 等 于 或 小 于 指定 会 话 数 时 触发 

当 访 客 在 此 会 话 或 所 有 会 话 中 拥有 大 于 、 等 于 或 小 于 指定 页 面 查看 
这 i 寸 触 发 
网 站 带 留 时 间 在 访问 持 经 了 指定 的 分 钟 : 守 发 
注册 用 户 恨 据 元 双 中 指示 时 用 户 注 册 状 态 侧 发 (需要 设置 ) 
在 数据 元 订 中 指示 用 户 已 登 ee 未 登录 时 触发 (需要 设置 ) 


0 
Cr 


URL 


页 面 查看 


另外 ， 关 于 Report builder (报表 生成 器 ， 适 用 于 Excel) 和 Visitor click map (访客 点 击 图 ) 是 各 个 网 站 分 析 工 具 都 具备 的 基础 应 用 ， 在 此 不 做 过 多 介绍 
3. 服 务 客户 


Adobe Analytics 的 客户 广泛 分 布 于 世界 各 地 ， 但 以 美国 市 场 最 为 集中 。 世 界 知名 的 客户 包括 : NBA、 苹 果 、eBay、AOL、1BM 官 网 、Hewlett-Packard、Wal-Mart、Expedia、Oracle、Discover 
Financial、Nortel Networks、SAP、Microsoft、Macromedia、 索 尼 、 新 蛋 、 尼 康 和 CBS Sportsline 等 。 国 内 客户 包括 : 银泰 网 、 太 平 洋 保险 、 李 宁 官 方 网 站 、 周 大 福 、 英 孕 教育、 国美 在 线 、 太 平 洋 保 
险 、 联 想 、 艺 龙 网 、 途 牛 网 等 。 


4. 国 内 市 场 现 状 


Adobe Analytics 进 入 中 国 市 场 较 早 ， 凭 借 其 技术 实力 及 在 华 跨国 子 公 司 占据 了 很 大 一 部 分 的 国内 市 场 ， 也 是 国内 付费 网 站 分 析 工 具 领 域 最 主要 的 工具 提供 商 。 但 国内 市 场 的 客观 环境 以 及 国外 企业 
的 “水 土 不 服 ”， 导 致 在 整个 中 国 市 场 的 表现 不 佳 。 


从 国内 客观 情况 来 看 ， 由 于 网 站 分 析 在 中 国 起 步 较 晚 、 国 内 客户 发 展 处 于 粗 狐 阶段 等 原因 ， 导 致 企业 对 网 站 分 析 的 认 知 程度 不 够 。 如 在 大 多 数 企业 只 购买 Adobe Analytics 工 具 本 身 而 忽视 外 部 服务 问 
题 ， 企 业内 部 又 缺乏 高 水 平 的 咨询 人 才 和 应 用 人 才 。 这 些 因 素 综合 导致 购买 Adobe Analytics 的 企业 基本 无 法 实现 其 价值 ， 在 投入 巨额 费用 的 情况 下 其 产 出 价值 和 应 用 层次 仅 比 免费 工具 高 一 点 ， 甚 至 还 有 的 
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公司 只 拿 它 来 做 进行 数据 的 基本 统计 。 


从 Adobe 对 中 国 市 场 的 政策 来 看 ，Adobe Analytics 在 中 国内 地 实行 多 代理 服务 商 制度 ， 国 内 的 八 又 乐 (VCC) 、 艾 瑞 、 网 舟 等 都 是 其 不 同 领域 的 代理 商 合作 伙伴 ， 所 有 内 地 企业 要 想 使 用 Adobe 
Analytics 必 须 跟 代 理 商 合作 ， 并 由 代理 商 提 供 产品 购买 和 服务 支持 。 但 由 于 代理 商 的 服务 水 平 参差 不 齐 、Adobe Analytics 对 国内 重视 程度 较 弱 等 问题 ， 其 服务 问题 一 直 被 国内 客户 诉 病 。 


5.1.2 Webtrekk 


1. 工 具 简 介 


Webtrekk 是 一 个 以 原始 数据 为 基础 ， 提 供 网 站 分 析 工 具 和 服务 的 公司 ， 它 诞生 于 德国 ， 在 阿姆斯特丹 、 柏 林 、 法 兰 克 福 、 米 兰 、 北 京 、 马 德里 和 旧金山 都 拥有 公司 或 办 公 室 ， 是 欧洲 领先 的 付费 站 分 析 
工具 服务 提供 商 。Webtrekk 是 欧洲 TUV 认 证 的 企业 之 一 ， 其 数据 安全 性 、 稳 定性 和 可 靠 性 程度 达到 世界 先进 水 平 ， 图 5-25 所 示 为 TUV 认 证 。 
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图 5-25 ”欧洲 TiV 认 证 
Webtrekk 可 以 实现 跨 营销 广告 、 跨 投放 媒体 、 跨 设备 (Web/WAP/APP) 的 数据 跟踪 及 A/B 测 试 功能 。 在 数据 整合 方面 ，Webtrekk 提 供 了 通过 自动 端口 和 多 数据 的 整合 方式 。 
2. 产 品 组 成 


Webtrekk 分 析 产 品 包括 Webtrekk Q3、Quick Insights 和 Live Analytics，Mobile Insights、TV Trekk、APP Trekk 和 Media Insights 为 其 中 重要 的 数据 分 析 模 块 ，Webtrekk 还 提供 了 SafeTage 作 为 
标签 管理 器 。Webtrekk 数 据 产品 间 的 数据 整合 较为 完善 ， 一 个 账号 便 可 无 颖 切换 。 图 5-26 所 示 为 Webtrekk 的 主要 产品 和 模块 。 
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图 5-26 ”Webtrekk 的 主要 产品 和 模块 


(1) Webtrekk Q3 


Q3 是 Webtrekk 的 核心 产品 ， 由 于 是 基于 原始 数据 (Raw Data) 的 网 站 分 析 系 统 ， 它 是 真正 的 点 击 流 数据 仓库 。Webtrekk 针 对 不 同 需求 和 不 同 的 使 用 对 象 ， 将 产品 划分 为 针对 中 高 级 、 中 低级 、 实 时 
三 种 对 象 的 分 析 产 品 ， 分 别 对 应 为 Q3、Quick Insights、Live Analytics。 


Q3 设 计 分 析 引 导 功能 进一步 强化 了 其 以 用 户 需求 为 导向 的 产品 思路 。 如 何 开始 一 个 分 析 过 程 yQ3 将 其 分 为 : 分 析 向 导 、 主 菜单 引导 、 表 格 生成 器 引导 。 
` 分析 向 导 针对 低 端 使 用 能 力 或 有 分 析 需 求 的 用 户 ， 直 接 通 过 常见 问题 (也 支持 自 定义 问题 ) 点 选 查看 ， 如 图 5-27 所 示 。 
. 主 菜单 引导 针对 具有 中 高 端 使 用 能 力 或 有 分 析 需 求 的 用 户 ， 直 接 可 以 在 菜单 中 点 选 ， 这 是 所 有 分 析 工 具 的 分 析 开 始 。 


. 表格 生成 器 引导 针对 高 端 使 用 能 力 或 有 深入 分 析 需 求 的 用 户 ， 直 接 在 表格 中 通过 任意 维度 (最 多 5 个 维度 ) 和 指标 (无 限制 ) 的 组 合 进行 数据 挖 据 和 分 析 ， 不 仅 如 此 ，Webttekk 还 支持 图 表 、 对 比 数据 
的 创建 ， 如 图 5-27 所 示 。 


Q3 产 品 的 功能 除了 包括 基本 的 网 站 汇总 数据 、 来 源 渠 道 数据 ( 自 定义 广告 媒介 、 免 费 搜索 和 付费 搜索 、 引 荐 来 源 、 来 源 路 径 ) 、 网 站 内 容 数 据 (网 站 所 有 页 面 、 进 入 页 面 、 退 出 页 、 页 面 路 径 ) 、 用 户 
数据 (地 域 、 新 老 访客 、 含 WAP 在 内 的 来 源 设备 分 类 及 具体 设备 信息 、 客 户 忠诚 度 、 购 买 回访 等 ) 外 ， 还 具有 以 下 独特 的 功能 特征 : 


市 场 豆 硝 洁 动 : 

访客 来 自 局 此 让 部 站 点 ? 

事 些 证 场 营 畏 活动 被 使 用 了 ? 
访 奎 使 用 何苦 撞 索引 擎 到 这 网 站 ? 
使 用 了 什么 搜索 证 可? 
流 重 源 是 ? 

访问 是 付 茧 还 是 名 费 获 得 的 ? 
使 用 了 何 种 拉 索 月 衣 ? 


有 条 少 访 竺 ? 

有 这 少 春 访客 了 回访 访客 ? 
访客 亲 目 在 些 国 京 ? 

访客 使 用 的 同族 张 务 商 ? 
访客 使 月 的 谢 葛 映 ? 
访客 来 自 鄂 些 城 休 ? 
访客 的 网 党 这 摊 建 度 ? 
访客 的 异 苇 分 状 烹 ? 
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导航 : 项 电子 商 务 : 

事 此 网 页 最 关 被 浏览 ? “cd 于 此 产品 有 最高 查看 晤 ? 

韦 些 网 页 被 作为 登陆 页 面 ? -人 | 蛋 些 产品 有 最 高 防 买 县 ? 

韦 些 网 页 被 作为 退 负 页面? - 堵 些 产品 经 党 被 放 入 购物 车 ? 
页 面 有 最 高 网 册 率 t 总 个 网 页 浏览 ? | 

素 些 物 接 有 最 高 的 点 土 谱 ? 


图 5-27 Q3 分 析 向 导 


更 小 的 数据 粒度 。Q3 的 所 有 数据 都 可 以 每 10 分 钟 为 单位 数据 范围 的 选择 ， 如 今天 可 以 选择 任意 和 天、 任意 小 时 、 任 意 10 分 钟 的 数据 范围 ; 今天 可 以 查看 昨天 2 点 10 分 到 2 点 30 分 的 数据 。 常 用 于 做 大 
型 促销 分 析 或 抢购 类 分 析 时 分 时 段 数据 的 对 比 。 


. 更 灵活 的 筛选 过 滤 。 筛 选 和 过 滤 功 能 可 以 应 用 于 任何 一 个 报表 和 数据 权限 管理 ， 尤 其 是 漏斗 、 路 径 及 用 户 数 据 权 限 划 分 等 ， 它 能 同时 支持 15 个 过 滤器 并 行使 用 。 
自由 拖 及 和 下 钻 功能 。Q3 支 持 类 似 Discovet 的 自由 拖 避 分 析 〈 称 为 数据 透视 表 ) ， 所 有 维度 和 指标 都 可 由 自己 自由 拖 提 ， 维 度 间 下 钻 支 持 4 层 对 象 ， 指 标 不 限 ， 如 图 5-28 所 示 。 


: 强大 的 数据 关联 模型 。 在 前 几 章 介绍 了 Webtrekk 的 数据 关联 模型 可 以 广泛 应 用 于 站 外 渠道 、 站 内 关键 字 、 站 外 关键 字 、 站 内 页 面 、 站 内 产品 查看 、 站 内 产品 购买 的 关联 分 析 ， 报 表 更 实用 且 应 用 范围 


一 


天 
: 更 低 的 数据 延 衣 性 。Q3 中 的 所 有 数据 延迟 最 多 为 两 小 时 。 


" 有 效 的 数据 整合 方式 。Q3 已 经 将 数据 整合 工作 所 需要 的 部 分 API 开 发 完成 并 集成 到 系统 中 ， 称 为 自动 端口 配置 ， 通 过 端口 简单 配置 信息 之 后 可 实现 与 外 部 相关 数据 的 对 接 。 目 前 支持 超过 50 个 合作 伙 
伴 ， 包 括 : Google AdWortds、Facebook、Optivo、Audiweb、eCitcle、Ctiteo 等 ， 另 外 还 支持 Excel 导 入 、SOAP、JSON 和 RAW DATA 整 合 。 


. 更 灵活 的 多 重 归 因 模型 。 除 了 在 4.3.2 节 中 介绍 的 支持 5 类 节点 的 归 因 外 ， 还 可 以 指定 归 因 类 型 。 传 统 意义 上 的 归 因 只 能 做 订单 归 因 ， 但 Webttekk 支 持 任何 自 定义 转 化 目标 归 因 ， 如 注册 、 下 载 、 加 入 购 
物 车 等 ， 针 对 不 同 目标 的 归 因 尤其 适合 网 站 业务 目标 广泛 或 针对 细 分 目标 的 分 析 。 图 5-29 所 示 为 可 以 任意 指定 已 经 定义 的 转化 目标 。 


无 法 添加 更 多 对 象 。 
请 去 除 当前 对 象 来 添加 新 的 。 或 使 其 包含 


~ 钵 {Nr.)。 


Wap/ 手 机 村 统 9 | Channel9 | Module9 | 访 


Wap/ 手 机 系统 10 | Channel10 | Module 10 记 


Wap/ 手 机 半角 11 | Channel 11 Module 11 | 请 


图 5-28 Q3 数 据 透 视 表 界面 


只 考 志 站 外 广告 媒体 | 
以 下 来 源 的 广告 媒体 会 被 作为 普通 广告 媒体 处 理 : 

搜索 引擎 优化 

其 它 访问 源 

社交 媒体 访问 源 

直接 进入 


属性 度量 
Cancellation Value 
在 所 有 广告 媒体 中 发 布 % New or Returning Customer 
Product Advertised 
Product View 
Return Value 
Shoppingcart 
SIlzZe 
数量 Cancellation Value 


图 5-29 Webtrekk 多 重 归 因 和 转化 设置 


在 Webtrekk Q3 中 ， 很 多 统计 学 计量 及 方法 被 用 到 与 网 站 分 析 相关 的 分 析 中 。 除 了 可 以 应 用 到 站 内 页 面 ， 站 内 、 外 搜索 词 、 站 内 产品 浏览 和 购买 、 站 外 来 源 广告 渠道 的 关联 数据 挖掘 模型 
外 ，Webtrekk 增 强 了 数据 汇总 时 数据 的 科学 性 ， 如 图 5-30 是 Webtrekk 汇 总 数据 报表 ， 报 表 中 有 以 下 两 个 方面 的 优化 值得 关注 : 


* 提供 了 更 多 的 整体 数据 查看 选项 。 通 过 对 数据 平均 值 、 最 大 值 、 最 小 值 、 汇 总 、 页 面 内 数据 汇总 等 指标 的 初步 评估 ， 能 够 发 现 所 选 数据 的 整体 分 布 情况 。 


. 提供 了 明显 的 可 视 化 功能 。 通 过 对 高 亮 、 柱 形 图 和 标识 图 的 设置 ， 系 统 能 自动 将 数据 表 中 的 异常 值 及 数据 间 的 关系 进行 对 比 呈 现 ， 利 于 人 们 发 现 数据 中 的 异常 点 ， 该 功能 对 于 为 领导 层 提供 日 常 的 自 
动 发 送 报告 非常 有 用 。 
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(2) Quick Insights 


Quick Insights 是 一 个 功能 介 于 Q3 和 Live Analytics 的 产品 ， 该 系统 中 对 日 常 应 用 报表 进行 了 归纳 ， 同 时 为 了 提高 易 用 性 ， 每 个 维度 只 能 和 一 个 维度 (天 ) 进 


Bounce Rate 各 
60.06 % 国 
67.13 % 国 国 
57.87 % 国 罗 
43.95 % 国 时 时 
57.14 % 国 列 国 
56.64 % 国 国 国 
61.11 % 本 时 到 
16.26 % 力 
36.84% 加 时 
27.78 % 国 国 

62.56 % 
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62.56 % 


Average llem per order 
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1.57 三 
1.54 三 
1.77 

1.60 者 
1.41 和 
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图 5-30 ”Webtrekk 汇 总 数据 报表 样 例 


行 交叉 分 析 。Quick Insights 的 出 发 点 非常 


简单 ， 普 通用 户 的 数据 分 析 维 度 通常 是 细 分 、 趋 势 、 对 比 ， 而 Quick Insights 把 这 个 功能 做 到 了 极致 。 因 此 ， 这 个 模块 适合 普通 业务 人 员 使 用 及 不 需要 深入 分 析 的 领导 层 。 


Quick Insights 用 户 只 需 


也 支持 定制 Dashboard 作 为 进入 落地 页 ， 方 便 用 户 进入 系统 后 直接 看 到 相关 数据 的 结果 。Quick Insights 界 面 ， 如 图 5-31 所 示 。 
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图 5-31 Quick Insights 界 面 
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通过 界面 直接 点 击 左 侧 菜 单 即 可 查看 相关 报表 。 左 侧 菜 单 中 的 报表 支持 所 有 Q3 中 的 数据 维度 ， 将 数据 分 为 覆盖 (热力 图 ) 、 访 客 、 市 场 曹 销 、 导 航 、 电 子 商 务 五 部 分 。 另 外 ， 
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(3) Live Analytics 


Live Analytics 定 位 于 实时 分 析 模 块 ， 它 是 Webtrekk 最 主要 的 实时 数据 支持 模块 ， 通 常 与 Quick Insights 结 合 使 用 效果 比较 好 ， 适 合 于 对 流量 实时 性 要 求 比较 高 的 应 用 场景 ， 比 如 双 十 一 、 双 十 二 这 种 
需要 精准 到 秒 级 别 的 数据 需求 。 图 5-32 所 示 为 进入 Live Analytics 后 的 界面 。 
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图 5-32 Live Analytics 界 面 


与 Adobe Analytics 等 其 他 网 站 分 析 工 具 不 同 ，Webtrekk 把 实时 分 析 功 能 单独 拿 出 来 并 作为 一 个 独立 的 分 析 模 块 ， 其 中 所 有 的 可 用 报表 都 是 实时 的 。 它 非常 适用 于 投影 仪 或 平板 电脑 ， 可 直接 把 定制 好 
的 报表 进行 播放 ， 报 表 会 每 10 秒 进行 更 新 。 这 种 应 用 对 于 领导 决策 层 或 实时 观察 数据 具有 重要 的 支持 作用 。 


Live Analytics 具 有 以 下 独 有 的 特征 : 
“ 每 10 秒 更 新 一 次 数据 。 无 论 什么 规模 的 数据 量 ，Webtrekk 都 能 做 到 每 10 秒 更 新 一 次 。 


. 时 间 选 择 更 灵活 。 可 以 选择 当日 、 过 去 30 秒 、 过 去 两 小 时 。 与 其 他 实时 性 报表 或 产品 不 同 的 是 ，Live Analytics 可 选 当 日 汇总 的 实时 数据 ， 即 其 他 系统 只 能 选择 最 近 两 小 时 、 最 近 30 分 钟 内 的 实时 数据 ， 
而 Live Analytics 可 以 选择 查看 当天 所 有 时 间 的 实时 数据 。 这 对 于 当日 密切 关系 业务 结果 的 业务 对 象 具有 非常 重要 的 参考 作用 和 执行 导向 。 


. 数据 维度 更 多 。 支 持 地 理 位 置 、 全 站 报表 、Refetral、Papge、 产 品 报表 等 常用 维度 。 
. 直接 报表 对 比 功能 。Live Analytics 支 持 实时 数据 的 对 比分 析 ， 可 将 今天 从 开始 堆 止 到 现在 的 实时 数据 与 昨天 此 时 的 数据 进行 对 比 。 
3. 服 务 客户 


Webtrekk 目 前 的 客户 主要 集中 在 欧洲 ， 客 户 领 域 履 盖 电子 商务 、 多 渠道 销售 终端 、 银 行 、 旅 游 、 通 信 、 媒 体 、 培 训 等 行业 。 世 界 知名 客户 包括 : 巴黎 银行 、 德 意志 银行 、 西 门 子 、 红 牛 、Wimdu、T- 
Mobile、MTV、Hugo Boss、Sprit、Hepsiburada 等 。Webtrekk 于 2013 年 10 月 进入 中 国 ， 现 有 客户 包括 泰康 人 寿 、 乐 视 商 城 、 大 朴 网 、 喜 事 网 、 改 联网 等 。 


4. 国 内 市 场 现状 
Webtrekk 面 临 的 国内 客观 环境 与 Adobe Analytics 相 同 ， 并 且 由 于 其 本 身 进 入 中 国 的 时 间 较 短 ， 缺 少 相应 的 品牌 沉 泌 及 客户 认 知 。 客 观 上 ， 所 有 从 国外 引进 的 工具 面临 的 问题 都 是 水 土 不 服 ， 从 国内 市 
场 环境 、 用 户 习 惯 、 企 业 需 求 、 人 才 储 备 和 培养 等 方面 都 有 很 长 的 路 要 走 。 


5.1.3 Webtrends 


1. 工 具 简 介 


Webtrends 作 为 网 站 分 析 工 具 的 鼻祖 (1993 年 成 立 ) ， 其 拥有 比 其 他 任何 工具 都 早 的 品牌 沉 洪 。 目 前 ，Webtrends 全 球 客户 覆盖 130 个 合作 伙伴 ， 共 设 有 5 个 办 公 室 ,分 别 在 波 特 兰 、 西 雅 图 、 伦 敦 、 
乌 普 萨 拉 (瑞典 ) 和 墨尔本 (澳大利亚 ) 。 


Webtrends 诞 生 在 早期 互联 网 的 发 展 时 期 ， 其 产品 也 体现 了 当时 的 技术 特点 ， 即 网 站 分 析 技 术 以 对 日 志 分 析 的 方式 呈现 ， 这 也 是 Webtrends 产 品 最 突出 的 特征 。 随 着 互联 网 技术 的 不 断 发 展 和 网 站 内 容 
的 日 新 月 异 ， 日 志 分 析 法 已 经 开始 出 现 不 适应 网 站 监测 分 析 需 求 的 情况 ， 为 了 跟 上 时 代 的 发 展 ，Webtrends 公 司 也 逐渐 提供 了 在 网 页 中 加 入 “标签 ”方式 的 监测 技术 ， 即 通过 SAAs 模 式 为 客户 提供 服务 ， 
但 通过 分 析 日 志 的 方法 依然 是 其 主要 的 产品 特征 。 

2. 产 品 组 成 

从 功能 上 来 看 ，Webtrends 并 不 逊色 于 其 他 网 站 的 分 析 工 具 ， 从 Web/WAP/APP 的 设备 跟踪 覆盖 ， 到 普通 的 广告 渠道 、 站 内 页 面 、 用 户 和 电子 商务 跟踪 ， 再 到 更 高 级 的 应 用 。 比 如 多 渠道 跟踪 、A/B 测 
试 和 优化 ， 甚 至 跟 SAP、CRM 和 SharePoint 打 通 做 数据 整合 应 用 的 功能 都 应 有 尽 有 。 


关于 以 上 功能 ， 虽 然 实 现 的 方法 不 同 ， 但 结果 差异 不 大 。 这 里 仪 介绍 Webtrends 在 最 新 版 本 10 中 特有 的 功能 一 一 增强 的 社会 化 媒体 的 数据 跟踪 ， Webtrends 通 过 API 与 YouTube、Twitter、Facebook 


打通 提供 了 更 多 分 析 视 角 。 


针对 YouTube 跟 踪 新 增 了 Impressions、Actions、Progress 三 个 指标 用 来 评测 用 户 在 YouTube 上 的 视频 曝光 量 、 点 击 次 数 和 进程 ， 另 外 还 包括 的 关键 指标 有 Views、Unique Viewers、Subscribers、 
Favorites、Onsite Plays、Onsite Full Plays、Onsite Impressions， 维 度 包 括 Traffic Sources、Playback Locations、Top Videos 等 。 更 多 指标 如 表 5-4 所 示 。 


表 5-4 Webtrends 针 对 YouTube 的 其 他 维度 指标 


Content People Technology 
Onsite: Videos + Cities Onsite: Browser Versions 


Onsite: Videos + Countries Regilons + Videos Onsite: Colors 

Onsite: Videos + Types Onsite: Area Codes Onsite: Flash 

Videos: Regions Onsite: Mobile Browsers 

Videos: Playback Locations Onsite: Countries Onsite: Mobile Devices + Browsers 
Videos: Traffic Sources Onsite: Network Types 


Onsite: Domains Onsite: OS + Browsers 
Traffic Onsite: Geo Drilldown Onsite: Resolutions 
Onsite: Referring Domains Onsite: GMT Offsets Onsite: Video Quality 
Onsite: Referring Pages Onsite: Hourly Browsing Activity Playback Locations 
Onsite: Videos + Search Eneines Onsite: Key Metrics Playback Locations + Videos 
Onsite: Videos + Search Keywords Onsite: Laneuages 


Onsite: Videos + Search Phrases Onsite: Reglons Campalen Reports 


Onsite: Videos + Traftfic Sources Onsite Sessions: Frequency Onsite: Campaien IDs 


针对 Twitter 跟 踪 指标 包 括 Tweets、Followers、New Followers、Retweeted、Replies、Mentioned、Following， 维 度 包 括 Top Tweets、Tweet Time 等 。Twitter 其 他 功能 还 包括 : 
* Houtrly update of tweets 
* View full tweet and reply messages 
* Create Date 
Replies Count 
* Retweets Count 
* Table data available ftom REST API 
* Ability to search content of tweets 
3. 服 务 客户 


Webtrends 的 国际 市 场 跟 Omniture 类 似 ， 以 美国 市 场 为 主 ， 且 服务 客户 领域 广泛 ， 包 括 媒 体 、 咨 询 、 旅 游 、 通 信 、 银 行 、 科 技 、 自 动 化 等 行业 ， 知 名 客户 如 微软 、 路 透 社 、eBay、BMW、AT&T、 
AUDI、Adidas、HP、Volvo 等 。 在 国内 ， 其 曾经 的 客户 覆盖 领域 较为 广泛 ， 其 中 包含 媒体 、 门 户 网 站 、 电 子 商 务 、 银 行 、 保 险 、 金 融 、 政 府 、 广 告 、 航 空 、 汽 车 等 。 其 客户 包括 : 中 国 银行 、 招 商 银行 、 
中 国 移动 、 联 通 、 电 信 、 中 信 证 券 、 金 融 界 等 证 券 机 构 、 当 当 网 /新 浪 网 、 华 时 报 等 ( 注 : 其 中 包含 曾经 使 用 过 该 产品 ， 但 后 期 更 换 和 放弃 使 用 的 客户 ) 。 


4. 国 内 市 场 现状 


Webtrends 于 1999 年 进入 中 国 ， 由 于 其 技术 实力 、 行 业经 验 及 国外 知名 客户 案例 ， 还 包括 其 本 地 化 部 署 方 式 ， 能 够 最 大 化 满足 国内 企业 数据 安全 性 的 需求 ， 因 此 初期 客户 规模 庞大 。 在 中 
国 ，Webtrends 和 Omniture (Adobe 直 到 2009 年 才 收购 Omniture) 是 国内 最 主要 的 两 家 付费 网 站 的 分 析 工 具 。 但 从 目前 的 情况 来 看 ， 国 内 市 场 表现 不 如 初期 。 


Webtrends 跟 Adobe Analytics 一 样 ， 都 是 通过 代理 服务 公司 进行 产品 和 服务 售卖 的 ， 如 博 新 创 亿 、 裔 海 等 都 是 其 代理 公司 。 但 国内 代理 公司 的 现状 上 文 已 经 提 到 ， 在 此 不 做 过 多 的 袭 述 。 


Webtrends 公 司 的 产品 主要 是 以 软件 销售 的 方式 将 产品 提供 给 客户 ， 由 客户 对 产品 进行 安装 、 调 试 和 使 用 ， 一 般 需 要 客户 在 单独 的 服务 器 上 安装 软件 以 保证 其 性 能 ， 产 品 的 前 期 采购 成 本 比较 高 ， 产 品 
升级 比较 复杂 ， 同 时 日 益 增 长 的 日 志文 件 存储 也 是 一 笔 不 小 的 开销 。 


另外 ， 保 险 、 金 融 、 银 行 、 航 空 等 属于 国家 高 度 控 制 的 产业 ， 数 据 的 安全 性 是 一 切 工作 的 前 提 ， 因 此 本 地 化 操作 模式 能 最 大 限度 满足 其 要 求 。 但 最 近 几 年 国内 政策 有 所 松动 ， 使 得 很 多 原 有 的 
Webtrends 客 户 转移 ， 如 太平 洋 保险 、 平 安保 险 等 。 


5.1.4 Google Analytics 


Google Analytics 由 于 其 免费 且 功 能 足够 满足 一 般 中 小 企业 的 需求 ， 因 此 是 世界 范围 内 认 知 度 最 高 的 网 站 分 析 工 具 之 一 。 

Google Analytics 的 网 站 分 析 工 具有 四 款 ， 分 别 是 Urchin、Google Analytics、Universal Analytics 和 Google Analytics Premium。 

以 下 介绍 四 款 工具 之 间 的 关系 。 

2005 年 3 月 ，Google 收 购 了 Urchin Software。 被 收购 的 Urchin Software 仍 然 保 留 Urchin 的 产品 ， 并 以 Google Urchin 继 续 为 企业 提供 网 站 分 析 服 务 。 


2005 年 11 月 ，Google Analytics 诞 生 并 免费 对 外 开放 使 用 。 从 Google Urchin 和 Google Analytics 初 期 的 功能 对 比 来 看 ， 两 者 功能 几乎 一 致 。 可 以 认为 ，Google Analytics 是 SAAS 版 ，Google Urchin 
是 本 地 安装 版 。 随 着 Google Analytics 不 断 发 展 ， 其 更 新 换代 速度 越 来 越 快 ， 不 断 推陈出新 直到 V5 版 本 ;而 Urchin 的 软件 更 新 速度 非常 慢 ， 直 到 2012 年 3 月 28 日 Urchin 不 再 对 外 提供 服务 时 ，Urchin 版 本 仅 
更 新 到 V7。 


2011 年 9 月 ，Google 推 出 了 付费 版 本 Google Analytics Premium， 并 希望 借 此 向 IBM 和 Adobe 系 统 的 类 似 服 务 发 起 挑战 。 同 一 年 ，Google 推 出 Universal Analytics 公 测 。 


2014 年 3 月 ，Universal Analytics 完 成 公测 并 发 布 正式 版 。 


Google 分 析 产 品 的 发 展 阶段 总 结 ， 如 图 5-33 所 示 。 
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图 5-33 Google 分 析 产 品 的 发 展 阶 段 


目前 ，Google 的 免费 与 付费 网 站 分 析 工 具 并 行 发 展 。 除 Urchin 外 ，Google 的 其 他 分 析 工 具 都 是 基于 SAAsS 服 务 模式 。 由 于 Urchin 已 经 淡出 历史 舞台 ， 在 此 不 做 过 多 的 介绍 ， 只 介绍 Google Analytics、 
Universal Analytics 以 及 Google Analytics Premium。 


1.Google Analytics 
(1) 产品 体验 


Google Analytics 是 所 有 网 站 分 析 工 具 中 易 用 性 最 好 的 工具 之 一 ， 尤 其 是 V5 版 本 之 后 用 户 体验 得 到 进一步 的 强化 。 图 5-34 所 示 为 Google Analytics 的 报告 界面 。 
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图 5-34 ”Google Analytics 的 报告 界面 


Google Analytics 虽 然 是 免费 的 产品 ， 但 在 大 多 数 的 功能 特征 上 毫 不 逊色 于 付费 工具 。 


. 高 级 细 分 : Google Analytics 的 高 级 细 分 功能 强大 ， 可 根据 除 时 间 序列 以 外 的 任意 维度 对 事件 进行 用 户 细 分 ， 在 V5 版 本 之 后 ， 该 细 分 可 应 用 到 任何 一 个 报表 中 ; 另外 ， 最 新 版 本 的 细 分 还 可 以 从 库 中 调 
取 ， 即 直接 使 用 别人 定制 的 细 分 群体 并 将 其 应 用 到 自己 的 报告 中 。 


. 指标 : Google Analytics 中 的 指标 均 采 用 通用 定义 标准 ， 并 且 很 多 都 已 经 成 为 了 业内 标准 。 


* 维度 : Google Analytics 中 涵盖 了 日 常 所 有 的 用 户 (受众 群体 ) 、 渠 道 〈 流 量 获取 ) 、 页 面 ( 行 为 ) 、 转 化 维度 ， 可 监测 Web/WAP/APP 中 所 有 的 用 户 行为 ， 完 全 能 够 满足 一 般 企业 的 日 常 应 用 和 分 析 需 


“ 数据 整合 : Google Analytics 的 数据 整合 功能 较 弱 ， 目 前 已 经 整合 好 的 外 部 系统 只 有 自身 的 Adwords 和 Adsense， 其 他 系统 数据 整合 需要 通过 API 上 传 。 
除了 具备 主要 维度 和 指标 外 ，Google Analytics 还 具备 以 下 独特 的 功能 : 


.多 渠道 路 径 。Google Analytics 是 较 早 提出 归 因 模型 (最 早 称 为 多 渠道 路 径 ) 的 工具 之 一 ， 目 前 支持 线性 、 时 间 衰 减 、 首 次 互动 、 最 终 互 动 、 根 据 位 置 的 归 因 模型 。 不 同 的 归 因 模型 有 不 同 的 参数 调 
节 ， 图 5-35 所 示 为 时 间 衰减 模型 的 配置 界面 。 在 该 模型 中 可 以 指定 时 间 衰 减 周期 、 回 溯 期 、 根 据 用 户 互动 度 调整 功 苏 、 应 用 自 定义 的 功劳 分 配 规则 等 参数 ， 这 些 参数 足以 用 来 进行 更 精细 化 的 设置 。 


“ 路 径流 。Google Analytics 的 路 径流 不 仅 可 以 应 用 于 页 面 路 径 ， 还 可 以 应 用 于 目标 路 径 、 事 件 路 径 等 。 对 内 容 进 行 分 组 后 ， 还 可 以 应 用 于 分 组 的 路 径流 ， 该 功能 强大 而 实用 ， 尤 其 对 于 站 内 流程 设计 、 
流量 引导 、 用 户 体验 设计 等 具有 极 大 的 参考 价值 。 


.分 组 功能 。Google Analytics 支 持 内 容 分 组 和 渠道 分 组 ， 在 分 析 维 度 中 增加 了 聚合 分 析 并 可 应 用 到 所 有 的 报表 、 细 分 和 过 滤 中 。 


* 自 定义 报告 。 自 定义 报告 可 以 根据 用 户 的 需求 ， 任 意 选 择 数 据 维度 和 指标 定义 符合 需求 的 报表 ， 该 报告 通过 自 定义 后 可 自动 呈现 ， 将 需要 日 常 整理 、 汇 总 、 发 送 的 报告 进行 定制 ， 有 利于 提高 工作 效 
率 。 图 5-36 是 Google Analytics 自 定义 报告 ， 该 报告 可 针对 每 个 登录 用 户 进行 关键 指标 统计 ， 其 数据 可 应 用 于 CRM 进 行 分 析 或 发 现 特定 用 户 的 异常 值 。 


(3) 产品 问题 
总 的 来 看 ，Google Analytics 是 免费 网 站 分 析 工 具 中 功能 最 为 强大 的 工具 。 纵 然 如 此 ，Google Analytics 仍 然 有 很 多 问题 ， 某 些 问 题 甚 至 已 经 成 为 “ 阿 克 琉 斯 之 中 ” 。 


" 自 定 义 功 能 弱 。 大 型 企业 对 于 数据 的 需求 灵活 性 高 ， 自 定义 功能 需求 大 ， 但 Goosle Analytics 自 身 可 自 定义 部 分 较 少 ， 尤 其 是 数据 采集 阶段 的 自 定义 维度 和 自 定 义 指标 的 采集 ， 已 经 成 为 Google Analytics 
采集 端的 主要 问题 。 
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图 5-35 ”Google Analytics 时 间 衰 减 模型 的 配置 界面 
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图 5-36 ” Google Analytics 自 定义 报告 


“ 数据 延 时 性 问题 。Google Analytics 提 供 的 数据 往往 有 24~48 小 时 的 延迟 ， 虽 然 引 入 了 新 的 实时 服务 ， 但 该 功能 仅 限 于 固定 时 间 段 的 国定 维度 和 指标 ， 无 法 提供 全 站 的 实时 数据 支持 。 数 据 延 迟 性 较 强 意 
味 着 数据 辅助 支持 作用 时 效 性 较 差 ， 尤 其 是 在 企业 有 重大 动作 (比如 大 促销 ) 时 无 法 支持 。 


* 数据 抽样 问题 。 当 企业 流量 超过 一 定 的 阅 值 时 ， 数 据 会 被 抽样 处 理 ，Google Analytics 的 数据 抽样 对 大 型 企业 来 讲 简直 是 灾难 性 的 问题 ， 它 会 影响 数据 的 可 信 度 以 及 不 同 抽样 比例 下 的 数据 结果 ， 造 成 
数据 不 一 致 的 问题 。 图 5-37 所 示 为 Google Analytics 的 数据 基于 总 会 话 数 的 0.12%， 这 说 明了 整个 报告 的 结论 只 选取 了 其 中 的 一 小 部 分 数据 得 出 ， 数 据 的 可 信 度 太 低 。 


此 报告 基于 248,901 次 会 话 总 会 话 数 的 0.12%)。 


图 5-37 ” Google Analytics 数 据 的 可 信 度 低 


全 + 辣 数据 抽样 问题 不 影响 整体 数据 ， 只 会 影响 细 分 报告 。 比 如 ， 基 于 渠道 、 页 面 内 容 、 用 户 必 性、 销售 订单 等 。 又 如 ， 全 站 总 数 是 对 的 ， 但 是 细 分 到 不 同 群体 下 ， 由 于 抽样 不 均等 问题 造成 细 分 数 
据 不 符合 整体 的 样本 情况 。 因 此 ， 如 果 不 做 数据 分 析 ， 只 看 整体 数据 ， 对 Google Analytics 的 数据 抽样 并 没有 影响 。 


" 数据 限制 问题 。 人 四 数据 收集 限制 : 对 单个 账号 每 月 请 求 处 理 量 有 10000000 的 限制 ， 对 超过 此 部 分 的 数据 需求 不 保证 一 定 可 以 处 理 。 这 意味 着 ， 如 果 企 业 的 数据 流量 较 大 ， 数 据 不 一 定 会 被 全 部 处 理 。 
@) 单 Session 数 据 限 制 : 每 个 Session 最 多 处 理 500 个 请 求 ， 超 过 的 请 求 不 予 处 理 。 


. 可 访问 性 问题 。 由 于 众所周知 的 原因 ，Google Analytics 经 常 无 法 访问 ， 这 使 得 原本 强大 的 功能 、 良 好 的 体验 毫 无 用 武之 地 。 当 然 ， 通 过 使 用 VPN、 修 改 HOST 等 途径 也 可 以 适当 减少 这 些 干扰 ， 但 这 不 
是 根本 的 解决 办 法 。 


` 售后 服务 问题 。Google Analytics 不 提供 任何 售后 服务 、 技 术 支 持 、 咨 询 服务 等 ， 任 何 关于 Google Analytics 的 问题 都 需要 企业 自己 解决 。 虽 然 Google Analytics 的 功能 比 付费 工具 的 部 署 、 配 置 和 应 用 要 简 
单 很 多 ， 但 仍然 具有 一 定 的 门槛 。 


. 数据 保留 问题 。Google Analytics 采 集 到 的 网 站 数据 的 保存 时 间 是 个 未 知 数 ， 虽 然 Google 承 诺 两 年 内 不 会 删除 ， 但 企业 总 不 能 只 考虑 两 年 内 的 数据 。 超 过 两 年 的 数据 该 如 何 处 理 ，Google 未 能 给 出 答复 ， 
这 也 给 企业 管理 数据 工作 埋 下 了 定时 炸弹 。 


2.Universal Analytics 
(1) 从 Google Analytics 升 级 到 Universal Analytics 
Universal Analytics 是 Google Analytics 的 升级 版 ，Google 鼓 励 企 业 尽 快 从 Google Analytics 升 级 到 Universal Analytics，Google Analytics 在 不 久 的 将 来 也 会 面临 Urchin 一 样 的 命运 。 


Universal Analytics 支 持 从 Google Analytics 直 接 升 级 ， 这 样 可 以 保证 在 原 有 的 Google Anaytics 账 号 中 的 数据 不 会 丢失 ， 同 时 又 能 使 用 全 新 的 Universal Analytics 进 行 数据 采集 、 处 理 和 报告 服务 。 从 
Google Analytics 直 接 升级 到 Universal Analytics 的 步骤 很 简单 ， 其 操作 步骤 如 下 。 


步骤 一 : 进入 Google Analytics 后 点 击 顶部 “管理 ”。 在 管理 界面 中 的 “媒体 资源 ”层次 中 会 出 现 “ 尚 未 开始 升级 ”字样 ， 如 图 5-38 所 示 。 


国 g 贝 户 设 畦 .从 Universal Analytics 升级 


尚未 开始 转 敌 
2 用户 管 理 回 ”网 络 媒体 资源 设置 
国 AdSense 天 联 sss 用户 管 理 


于 ”所 有 过 滤器 js 跟踪 信息 


多 更改 历史 记录 AdWords 关联 


图 5-38 ”从 Google Analytics 升 级 到 Univetsal Analytics 


步骤 二 : 单 击 Universal Analytics， 跳 转 到 Universal Analytics 升 级 界面 。 单 击 图 5-39 中 的 “转移 ”按钮 ， 系 统 即 开始 进行 数据 迁移 。 该 过 程 可 能 需要 24~48 小 时 。 


人 @ 转移 到 Universal Analytics 
点 击 转移 将 此 媒体 资源 转移 到 Universal Analytics 处 理 技术 。 和 你 新 赤 步 台 中 史诗 浊 他 关 一 硕 症 作 ， 


Google Analytics 分析) 需要 248 小 时 才能 元 成 转 穆 。 
te Ed dod Ed a 


转移 完成 后 ， 您 之 前 使 用 旧版 跟踪 代码 (ga.js) 收集 的 所 有 数据 都 将 通过 Universal Analytics 技术 进行 处 理 。 要 获得 Universal Analytics 的 全 部 好 处 ， 请 实现 新 
的 跟踪 代码 (anmaljyfics.jsl。 


在 转移 前 收集 的 所 有 数据 都 将 得 到 保存 ， 和 开 且 仍 会 显示 在 您 的 报告 中 。 


图 5-39 ”Universal Analytics 的 数据 转移 


步骤 三 : 转移 功能 实现 后 ， 图 5-39 中 的 状态 会 显示 为 完成 ， 并 可 以 进行 下 一 步 配 置 ， 如 图 5-40 所 示 。 在 该 步骤 中 可 以 单 击 “ 获 取 跟 踪 代 码 ” 按 钮 ， 并 用 最 新 的 Universal Analytics 跟 踪 代码 蔡 换 掉 原 来 
的 Google Analytics 跟 踪 代 码 。 


@ 转移 到 Universal Analytics 
@ 实现 Universal Analytics 跟踪 代码 


| 正在 转移 媒体 资源 


人 Universal Analytics 需要 24-48 小 时 。 转 移 过 程 完成 后 ， 您 将 获得 新 瞩 本 的 跟踪 代码 。 您 需要 实现 谅 代码 才能 获得 Universal Analytics 的 全 部 


访问 Universal Analytics 升 饥 中 心 了 解 详情 。 


‘可 造 ) 为 您 的 会 合 和 广告 系列 配置 超时 处 理 方式 。 这 些 借 和 二 可 供 您 用 来 控制 会 傅 和 三 告 系列 在 持续 多 长 时 间 之 后 过 期 。 
请 在 刘 传 资源 转 称 完 成 之 前 先 配置 这 些 设置 ， 以 确保 数据 的 库 桂 性 。 


”显示 超时 保 音 


图 5-40 ”获取 Universal Analytics 跟 踪 代 码 


全 注 总 使 用 最 新 的 Universal Analytics 跟 踪 代码 替换 掉 原 来 的 Google Analytics 跟 踪 代 码 仅 仅 实 现 了 基本 页 面 跟踪 的 替换 ， 即 通用 页 面 代 码 替 换 部 分 ， 如 果 网 站 中 包含 其 他 的 自 定义 代码 ， 如 事件 追踪 、 
电子 商务 跟踪 等 ， 都 需要 按照 Universal Analytics 代 码 规则 重新 部 署 。 


(2) Universal Analytics 与 Google Analytics 的 异同 点 


Universal Analytics 与 Google Analytics 在 产品 体验 、 产 品 功能 、 产 品 问题 、 报 告 展现 、 系 统 配置 、 安 全 隐私 等 方面 基本 一 致 ，Universal Analytics 与 Google Analytics 没 有 新 增 任何 报告 。Universal 


Analytics 与 Google Analytics 相 比 具 备 更 多 功能 ， 同 时 数据 采集 和 处 理 逻 辑 上 发 生 了 变化 ， 以 下 是 两 者 主要 的 差异 点 : 
“ 更 多 自 定义 采集 功能 。Universal Analytics 支 持 通过 自 定义 维度 和 自 定义 指标 在 数据 采集 端 增加 数据 分 析 角 度 ， 自 定义 维度 和 自 定 义 指 标 分 别 可 使 用 20 个 。 


. 引荐 的 处 理 方式 与 Goosle Analytics 中 不 同 。 默 认 情 况 下 ， 所 有 引 戎 都 会 在 Univetsal Analytics 中 触发 新 会 话 。 举 例 来 说 ， 如 果 访 问 者 离开 网 站 后 又 蕊 上 回访 ， 系 统 会 认为 该 访问 者 发 起 了 两 次 会 话 ， 而 在 
原来 的 Google Analytics 计 算 逻 辑 中 ， 如 果 时 间 在 30 分 钟 内 即使 是 多 次 回访 仍然 只 算 作 1 次 会 话 。 可 以 修改 跟踪 代码 ， 设 置 引 荐 排除 功能 ， 以 排除 所 有 来 自 特定 域 的 引荐 流量 。 


` 在 后 人 台新 增 了 数据 采集 规则 。 在 原 有 的 Google Analytics 中 ， 要 新 增 搜索 引擎 列表 、 排 除 引 茬 来源、 排除 搜索 关键 字 、 设 置 会 话 和 过 期 时 间 等 只 能 通过 代码 实施 控制 ; 但 在 Universal Analytics 中 ， 这 些 都 
通过 后 台 配 置 实现 ， 另 外 Univetrsal Analytics 去 掉 了 自 定义 跟踪 代码 参数 的 功能 ， 只 能 默认 使 用 Utm 参 数 实现 跟踪 。 
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“ 使 用 了 最 新 的 跟踪 代码 和 代码 库 。Univetsal Analytics 包 含 三 种 新 版 本 的 跟踪 代码 ， 不 同 的 代码 用 来 实现 特定 的 技术 需求 。 其 中 ，analytics.js JavaSctipt 库 用 于 网 站 ，Google Analytics SDK (v2.x 或 更 高 版 
本 ) 用 于 移动 应 用 跟踪 ， 而 Measufement Ptotocol 用 于 游戏 机 、 信 息 亭 等 其 他 设备 。 所 有 新 的 收集 方法 都 能 让 开发 者 方便 地 使 用 ， 尤 其 是 网 站 的 跨 域 跟踪 大 大 简化 ， 而 且 更 加 准确 。 


3.Google Analytics Premium 


Google Analytics Premium 作 为 Google 的 付费 应 用 ， 其 目标 是 覆盖 大 型 企业 ， 目 前 已 经 合作 的 公司 包括 旅游 服务 网 站 Travelocity.com、 著 名 奢侈 品 生产 商 Gucci Group NV、 美 国信 用 报告 机 构 
TransUnion Corp. 以 及 披萨 品牌 Papa John′”s International Inc. 等 ， 国 内 还 没有 客户 案例 。Google Analytics Premium 的 销售 可 以 通过 认证 合作 伙伴 ， 也 可 以 直接 联系 Google 购 买 ， 目 前 仅 提供 针对 美 
国 、 加 拿 大 、 英 国 、 西 班 牙 、 法 国 、 德 国 、 日 本 和 拉美 等 国家 和 地 区 的 销售 服务 。 


相 比 Universal Analytics 和 Google Analytics，Google Analytics Premium 具 有 以 下 优势 。 

(1) 数据 处 理 能 力 提升 

* 每 月 10 亿 次 请 求 限 额 ， 适 合 中 等 流量 规模 的 企业 。 

“ 数据 延迟 在 4 小 时 内 ， 延 时 性 虽 有 提高 但 仍然 不 占 优势 。 

数据 不 抽样 ， 不 抽样 是 付费 工具 最 基础 的 入 门 条 件 。 

(2) 数据 整合 分 析 能 力 增强 

. 支持 高 达 50 个 自 定义 变量 ， 这 个 数字 对 大 多 数 付费 企业 都 足够 用 。 

* 非 抽 样 自 定义 、 未 合并 大 型 报告 下 载 ( 每 次 下 载 多 达 1000000 行 ) ， 这 是 付费 工具 的 最 基本 条 件 。 

. BigQuery Export，Google Analytics Premium 客 户 可 以 将 包括 Google Analytics 在 内 的 外 部 数据 导入 至 Google BisQuery， 或 者 将 Google Analytics Premium 的 数据 导出 来 实现 数据 集成 。 

(3) 提供 服务 和 咨询 支持 

施 咨 询 及 部 署 和 管理 。 

* 账户 管理 员 专 家 24X7 紧 急 支 持 。 

“ 谷歌 账户 管理 专家 、 操 作 和 培训 。 

电话 和 电子 邮件 支持 10 个 小 时 。 


Google Analytics 标 准 版 与 Google Analytics Premium 对 比 总 结 ， 如 图 5-41 所 示 。 


服务 与 支持 Google Analytics 标准 版 。 Google Analytics Premium 
专属 客户 经 理 
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实施 审计 
京 施 浆 持 

全 惑 专家 增 训 | 
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图 5-41 Google Analytics 标 准 版 与 Google Analytics Premium 对 比 


5.1.5 IBM Coremetrics 


自从 2010 年 Coremetrics 被 I BM 收购 之 后 ，Coremetrics 就 作为 IBM 中 EMM (Enterprise Marketing Management) 的 一 部 分 而 存在 。IBM Coremetrics 主 要 包括 两 部 分 : 网 站 分 析 套 件 (Web 
Analytics Suite) 和 数字 营销 优化 套件 (Digital Marketing Optimization Suite) 。 


Coremetrics 也 是 基于 SAAS 的 服务 模式 ， 客 户 遍 及 零售 、 金 融 服 务 、 媒 体 与 出 版 业 、 旅 游 与 酒店 业 以 及 教育 等 行业 ， 包 括 假日 酒店 (Holiday Inn) 、PETCO、1-800 Flowers、 欧 迪 办 公 (Office 
Depot) 、 维 多 利 亚 的 秘密 (Victoria”s Secret) 、 维 珍 航空 (Virgin Atlantic Airways) 和 西 东 大 学 (Seton Hall University) 等 。 


1. 网 站 分 析 套 件 

Coremetrics 网 站 分 析 套件 是 针对 网 站 流量 统计 、 分 析 和 数据 挖掘 的 解决 方案 ， 具 体 包 括 以 下 功能 : 
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以 上 功能 与 其 他 网 站 分 析 工 具 大 同 小 异 ， 在 此 重点 介绍 一 些 有 区 别 的 功能 特征 。 

(1) 渠道 Venn 报 表 

Coremetrics 中 的 渠道 Venn 报 表 ， 可 以 用 来 做 渠道 组 合 效果 分 析 。 通 常情 况 下 ， 做 渠道 效果 分 析 时 会 考虑 渠道 效果 组 合 的 问题 ， 该 问题 可 以 通过 渠道 路 径 、 多 渠道 路 径 或 渠道 关联 模型 做 分 析 。 但 
Coremetrics 单 独 提供 了 一 个 报表 用 来 做 渠道 组 合 收益 分 析 ， 即 哪 几 个 渠道 的 组 合 会 产生 什么 样 的 订单 提升 效果 。 

图 5-42 所 示 为 一 个 渠道 Venn 报 表 ， 该 报表 显示 分 组 D+ 渠道 A 会 产生 6.71% 的 销售 效果 提升 ， 但 分 组 D+ 渠道 B 会 产生 34.69% 的 销售 效果 下 降 。 该 报告 直观 地 从 数据 的 角度 解读 了 某 些 渠 道 之 间 交 叉 后 对 
销售 的 贡献 作用 。 


salesl Visitor 


Region | Sales/Visitor 
| A: Email 
BB: Paid Search 
CG: Display 


ai [AND] Display [AND NOT] Paid Search | 


EE 和 


Region ™ Visitors | Sales v | SalesiVisitor v | SHI sar | SolReA sitar Salea/Visitor 

Total 39,612 $46,439 $1.17 
| A: Email [AND NOT] Paid Search [AND NOT] Display 11.394 。 归 11.394 $1.02 

| Switoh to Trend View to Select Specific Regions |Display 0.304 $15,530 $1.87 
[| C: Display [AND NOT] Email [AND NOT] Paid Search 10,293 $9.019 $1.50 
[| OD: Email [AND] Paid Search [AND NOT] Display 3,.495 $3.810 $1.00 8.71% -34.69% 
|_| E: Email [AND] Display [AND NOT] Paid Search 2,360 $1.808 $0.78 -25 05% -13.67 吗 
[| F: Paid Search [AND] Display [AND NOT] Email 1.903 $2.758 再 1.45 -13.17 台 B5.40 晤 
[| G:Email [AND] Paid Search [AND] Display 833 51.784 $2.14 109.64% 28.31 双 144.42 鸡 


图 5-42 ”Coremetrics 渠 道 Venn 报 表 
(2) 可 视 化 渠道 路 径 
Coremetrics 支 持 站 外 路 径 的 可 视 化 分 析 ， 在 之 前 的 工具 中 对 于 站 外 渠道 关联 的 探索 集中 在 渠道 关联 模型 分 析 、 单 条 渠道 路 径 分 析 ， 而 Coremetrics 的 渠道 路 径 报告 能 将 站 外 渠道 司 的 流量 转换 通过 路 径 
流 的 方式 展示 出 来 。 
如 图 5-43 所 示 为 Coremetrics 渠 道路 径流 ， 其 中 每 个 渠道 节点 都 可 以 点 击 +， 向 前 探索 其 前 一 步 的 来 源 路 径 和 渠道 分 布 。 该 报表 突破 了 之 前 只 能 做 两 个 渠道 或 一 条 路 径 内 有 限 几 个 渠道 的 关系 分 析 ， 使 得 
对 于 渠道 的 路 径 分 析 能 跟 普通 的 数据 报表 一 样 ， 有 汇总 、 有 下 钼 ， 从 而 提供 整体 和 细 分 的 路 径流 。 如 最 后 来 源 为 Email 的 渠道 总 订单 人 数 为 4598， 其 前 一 步 最 高 的 几 个 来 源 分 别 是 Google+、Paid Search 和 


Facebook， 每 个 渠道 为 Email 带 来 的 订单 人 数 都 可 以 直接 通过 数据 细 分 ， 其 中 的 付费 搜索 渠道 的 再 上 一 步 来 源 主要 是 Google+、Facebook、 付 费 搜索 和 联盟 推广 ， 这 样 一 层 层 向 上 推导 可 以 找到 不 同 渠道 
间 的 订单 贡献 关系 。 值 得 注意 的 是 ， 其 中 除了 可 以 获知 渠道 信息 外 ， 还 有 时 间 信息 ， 如 从 Facebook 到 Email 的 时 间 为 10.2 天 ， 这 为 业务 操作 提供 了 更 加 明确 的 执行 方向 。 
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图 5-43 ”Coremetrics 渠 道路 径流 


2. 数 字 营 销 优化 套件 

Coremetrics 数 字 营 销 优化 套件 是 从 网 站 分 析 套 件 中 获取 数据 洞察 和 价值 驱动 点 ， 然 后 整合 到 自身 营销 优化 的 应 用 中 ， 可 通过 网 络 、 社 交 和 移动 应 用 等 有 针对 性 地 进行 业务 活动 。 具 体 包括 : 
* Coremetrics AdTareet 

+ Coremetrics LIVEmail 

* Coremetrics Intelligent Offer 

+ Coremetrics Search Matketing 

由 于 业务 整合 和 优化 套件 不 是 本 书 的 重点 ， 在 此 不 作 过 多 的 介绍 。 


以 上 四 款 工具 代表 了 国内 目前 主流 的 付费 网 站 分 析 工 具 ， 除 此 以 外 ， 秒 针 、 精 硕 、 传 漾 、 科 捷 99click、iResearch、Comscore 等 也 提供 付费 网 站 分 析 工 具 或 相应 的 网 站 数据 统计 及 分 析 功 能 。 除 了 付费 
工具 以 及 免费 的 Google Analytics， 再 给 大 家 介绍 两 款 免费 且 实 用 的 网 站 分 析 工 具 。 


5.1.6 Piwik 


Piwik 是 一 个 基于 PHP 和 MySQL 的 开放 源 代码 的 网 站 统计 分 析 工 具 ， 其 前 身 是 phpMyVisites。Piwik 提 供 了 常用 的 网 站 分 析 维 度 ， 包 括 访客 分 析 、 页 面 分 析 、 来 源 分 析 和 电子 商务 分 析 四 个 维度 ， 可 以 
监测 Web/WAP、 自 定义 维度 、 目 标 跟踪 、 自 定义 广告 参数 、 电 子 商 务 跟踪 、 站 内 搜索 、 跨 域 跟踪 、 事 件 跟踪 等 。 
1.Piwik 独 有 的 优势 和 特征 


Piwik 不 仅 涵 盖 了 所 有 日 常 网 站 数据 分 析 所 需要 的 丰富 维度 ， 还 具有 一 些 高 级 特性 一 一 支持 高 级 细 分 。 这 些 细 分 可 以 基于 任意 报表 中 的 维度 和 指标 并 进行 任意 拖 抱 ， 如 图 5-44 所 示 。 
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图 5-44 Piw 这 高 级 细 分 设置 


实时 报表 。 在 Piwik 登 录 页 的 默认 页 面 中 ， 有 一 个 实时 报表 Widget。 该 报表 几乎 能 实时 显示 网 站 的 流量 情况 ， 数 据 每 5 秒 更 新 一 次 ， 数 据 会 显示 最 近 3 分 钟 内 的 访问 次 数 及 活动 次 数 (页 面 浏览 量 ) 。 另 
外 还 可 以 显示 最 近 24 小 时 和 最 近 30 分 钟 内 的 访问 数 和 浏览 量 ， 并 显示 最 近 访 客 的 基本 信息 ， 包 括 来 源 渠道 、IP、 地 域 、 操 作 系统 、 浏 览 器 、 着 陆 页 等 ， 如 图 5-45 所 示 。 
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图 5-45 ”Piw 还 实时 报表 


路 径 报 表 (转换 分 析 ) 。Piwik 路 径 报表 非常 实用 ， 它 将 流量 来 源 按照 来 源 属性 进行 划分 ， 包 括 站 内 和 站 外 两 大 部 分 。 站 内 来 源 分 为 站 内 普通 页 面 和 站 内 搜索 ， 站 外 来 源 分 为 搜索 引擎 、 网 站 (引见 链 
接 ) 、 广 告 活动 、 直 接 访问 。 图 5-46 所 示 为 某 页 面 的 来 源 及 下 一 步 的 用 户 流向 。 
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图 5-46 ”Piw 还 页 面 路 径 报表 (转换 分 析 ) 
数据 集成 功能 。Piwik 数 据 保存 为 结构 化 的 用 户 行为 数据 ， 这 极 大 方便 企业 做 点 击 流 数 据 与 其 他 数据 的 集成 服务 ， 同 时 还 支持 将 Log 日 志 导 入 系统 进行 分 析 。 
安全 性 。Piwik 为 本 地 安装 和 使 用 ， 这 意味 着 所 有 数据 都 是 在 企业 局 域 网 内 操作 和 运转 的 ， 不 会 发 生 数据 传输 到 外 部 的 情况 ， 有 效 地 保证 了 数据 的 安全 性 。 
二 次 开发 。 整 个 Piwik 都 是 基于 开源 的 框架 开发 ， 企 业 在 有 技术 实力 的 情况 下 ， 可 以 根据 自身 的 需求 进行 定制 化 开发 ， 在 免费 的 同时 还 能 满足 个 性 化 的 需要 。 
2.Piwik 应 用 问题 和 不 足 


. 框架 处 理 效率 问题 。Piw 让 框架 设计 基于 本 地 的 PHP+MySQL 实 现 ， 目 前 还 不 支持 集群 和 分 布 式 作业 。 官 方 提供 的 信息 是 整个 系统 设计 可 以 满足 100 万 PV 数 据 负载 量 ， 但 数据 量 超过 此 范畴 之 后 的 整个 系 
统 稳定 性 和 效率 都 无 法 保证 。 


. 不 支持 APP。 目 前 Piw 让 只 能 基于 页 面 标签 fS 进 行 数 据 和 采集 ， 尚 未 发 布 针 对 APP 应 用 的 数据 采集 方案 。 


. 海量 数据 下 的 实时 报表 无 法 使 用 。 实 时 报表 的 目的 是 获得 最 低 延 迟 的 数据 ， 但 当面 临海 量 数据 时 ， 服 务 器 很 难 在 短 时 间 内 处 理 完毕 并 获得 实时 报表 。 官 方 建议 对 于 低 流 量 的 网 站 ， 可 以 使 用 默认 的 10 
秒 配置 实时 处 理 所 有 报表 ; 对 于 中 高 流量 的 网 站 ， 建 议 最 多 每 隔 半 小 时 或 一 小 时 处 理 一 次 报表 ( 注 : 官方 建议 的 是 处 理 频率 ， 但 处 理 的 完成 时 间 无 法 保证 ) 。 


` 本 地 化 维护 问题 。Piw 玉 的 本 地 化 在 带 来 便利 性 的 同时 ， 也 在 其 他 方面 (主要 是 IT) 增加 了 相应 成 本 : I 硬件 投入 、 专 业 的 [维护 、 高 水 平 的 网 站 分 析 师 、 开 发 工程 师 都 是 保证 系统 良好 运行 的 必 备 条 
件 。 

Piwik 作 为 一 款 免费 + 开源 + 本 地 的 网 站 分 析 工 具 ， 更 适合 于 中 小 型 企业 了 解 网 站 分 析 工 具 使 用 ,或 者 企业 可 以 根据 Piwik 做 二 次 开发 形成 企业 的 定制 产品 。 即 便 如 此 ， 深 入 了 解 网 站 分 析 工 具 的 底层 工作 
原理 并 具备 一 定 技术 能 力 的 网 站 分 析 师 必 不 可 少 ， 可 惜 这 样 的 人 才 很 少 ， 尤 其 对 于 大 型 企业 来 说 ， 选 择 Piwik 仍 具有 很 大 的 风险 。 


5.1.7 ”百度 统计 


凭借 百度 在 国内 搜索 引擎 霸主 的 地 位 、 广 泛 的 SEM 客 户 资源 、 雄 厚 的 技术 实力 和 较 低 层次 的 国内 需求 ， 百 度 统计 已 经 成 为 世界 上 应 用 最 多 的 免费 网 站 分 析 工 具 之 一 。 


百度 统计 功能 简单 实用 ， 页 面体 验 较 好 ， 其 功能 侧重 点 是 统计 功能 ， 统 计 方 向 包括 站 外 来 源 (能 区 分 搜索 引擎 和 搜索 词 ) 、 站 内 页 面 浏览 (区 分 进入 页 面 、 退 出 页 面 、 热 力图 和 页 面 上 下 游 ) 、 访 客 分 
析 (地 域 、 新 老 访 客 、 设 备 系统 和 忠诚 度 ) 三 个 常规 方面 ， 覆 盖 Web/WAP/APP， 通 过 自 定 义 还 可 实现 跨 屏 分 析 、 子 目录 、 转 化 路 径 、 事 件 跟踪 和 自 定 义 变量 分 析 。 


以 下 介绍 百度 统计 功能 的 重要 特征 : 


. 集成 其 他 百度 工具 。 账 户 打通 后 ， 除 百度 统计 原 流量 部 分 的 统计 功能 外 ， 百 度 统计 会 新 增 “ 推 广 分 析 ” 部 分 ， 推 广 分 析 为 百度 推广 客户 自动 区 分 了 凤 策 、 网 盟 、 品 牌 植 入 、 知 心 等 各 推广 渠道 ， 且 打 
通 了 商 桥 、 离 线 宝 、 移 动 建站 等 一 系列 效果 的 工具 数据 ， 客 户 可 以 方便 的 基于 PC 与 无 线 等 不 同 纬度 进行 推广 效果 评估 。 


“ 集成 SEO 功能 。 百 度 统计 默认 具有 针对 SEO 的 相关 功能 ， 包 括 SEO 建 议 、 搜 索 词 排名 、 索 引 量 、 网 速 诊 断 、 外 链 分 析 、 抓 取 异 常 等 ， 这 些 都 是 企业 SEO 的 重要 参考 点 。 


.点击 热力 图 。 百 度 页 面 点 击 热力 图 分 为 基于 链接 的 热力 图 和 基于 像素 的 热力 图 ， 百 度 热 力图 无 须 单独 部 署 且 热 力图 无 错位 ， 是 所 有 网 站 分 析 工 具 中 最 好 用 的 热力 图 之 一 。 但 该 热力 图 的 时 间 选 择 只 能 
是 默认 的 昨天、 前 天 、 最 近 7 天 和 最 近 30 天 ， 无 法 自 定义 时 间 。 


. 跨 屏 分 析 。 百 度 跨 屏 分 析 实际 是 打通 百度 统计 和 百度 移动 统计 ， 然 后 将 两 者 数据 做 汇总 统计 。 跨 屏 分 析 包 括 三 部 分 数据 : PC、APP 的 UV 和 PV 数 量 以 及 访问 时 长 ， 用 户 趋势 图 和 跨 屏 用 户 访问 明细 。 
. 百度 统计 的 其 他 功能 点 如 页 面 上 下 游 ( 类 似 于 路 径 ) 、 转 化 路 径 等 都 需要 做 特定 掩埋 码 或 提前 指定 路 径 ， 应 用 局 限 性 较 大 。 


整体 来 看 ， 百 度 统计 满足 了 企业 网 站 分 析 入 门 时 只 看 数据 的 需求 ， 尤 其 在 做 大 规模 的 百度 投放 客户 数据 结合 后 更 利于 SEM 优 化 。 


5.2 移动 分 析 工 具 


移动 分 析 工 具 特 指针 对 APP 的 数据 分 析 工 具 ， 以 上 网 站 分 析 工 具 中 除 Piwik 不 支持 APP 分 析 外 ， 其 他 工具 都 支持 通过 SDK 的 形式 进行 APP 数 据 监测 分 析 。 由 于 APP 的 数据 监测 分 析 上 有 具有 特殊 性 ， 以 下 选择 
内 外 最 有 代表 性 的 Flurry 和 友 盟 ， 分 别 介绍 针对 APP 的 数据 监测 分 析 。 


5.2.1 Flurry 


Flurry 是 国外 的 一 款 基于 SAAs 的 免费 移动 应 用 分 析 工 具 ， 其 总 部 设 在 旧金山 ， 在 纽约 、 伦 敦 、 芝 加 哥 和 孟买 设 有 办 事 处 。Flurry 是 移动 应 用 统计 分 析 领 域 的 标杆 ， 支 持 ISO、Android、Blackberry、 
Windows 平 台 以 及 使 用 Java 开 发 的 平台 跟踪 ， 除 了 统计 单个 应 用 内 的 各 类 数据 指标 外 ， 还 可 以 提供 跨 应 用 之 间 的 转化 统计 等 针对 企业 级 用 户 的 功能 。Flurry 在 移动 应 用 分 析 领 域 的 地 位 与 Google Analytics 
在 全 球 网 站 分 析 领 域 类 似 。 


1.Flurry 的 数据 视角 
(1) 数据 维度 


Flurry 的 数据 维度 涵盖 了 用 户 的 整个 生命 周期 过 程 : 用 户 先 后 经 过 外 部 渠道 获取 、 应 用 APP、APP 留 存 ， 最 后 成 为 受众 ， 如 图 5-47 所 示 。 
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图 5-47 APP 用 户 的 生命 周期 图 


Flurry 报 告 菜单 分 为 Usage (应 用 ) 、Retention (留存 ) 、Audience (受众 ) 、User Acquisiton (用 户 获 取 ) 、Events (事件 ) 、Errors (错误 ) 、Technical (技术 ) 和 Manage (管理 ) ， 如 图 5- 
48 所 示 。 
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图 5-48 ”Flurry 应 用 报告 界面 


.Usage。Usage 是 所 有 用 户 使 用 概况 的 汇总 报表 。 该 报表 包括 New Users (新 用 户 ) 、 Sessions (会 话 ) 


生命 周期 ) 、 用 户 ) 、Top Versions (热门 版 本 ) 


、Active Usets (活跃 用 户 ) 


、Page Views (页 面 浏 览 ) 。 


、Session Length (会 话 长 度 ) 、Frequency of use (使 用 频率 ) 、 


Lifecycle ( Recent Usets (最 近 


Retention。Retention 是 用 户 留 存 的 相关 数据 ， 用 户 留 存 是 用 户 从 新 用 户 到 老 用 户 转化 的 必然 过 程 ， 留 存 率 越 高 代表 用 户 黏 性 越 大 。 报 表 和 包括 Retrurn Rate (回访 比例 ) 、Rolling (留存 率 ) 


、 Sessions Per 


User (每 位 用 户 会 话 ) 、Recent Usets (最 近 用 户 ) 。 
Audience。Audience 包 括 两 部 分 : 一 是 受众 兴趣 ; 二 是 受众 属性 。 受 众 兴 趣 分 为 两 类 : 其 一 是 当前 应 用 的 用 户 对 开发 者 其 他 应 用 的 兴趣 ; 其 二 则 是 当前 应 用 用 户 对 同类 型 应 用 的 感 兴趣 程度 。 受 众 属 

性 ， 包 括 用 户 的 年 龄 、 性 别 、 地 理 位 置 、 语 言 信 息 等 。 报 表 包 括 Intetest: My Apps (兴趣 : 我 的 应 用 ) 、Intetests: Category (兴趣 : 分 类 ) 、Personas (外貌) 、Age (年 龄 ) 、Gendet (性 别 ) 、 

Getogtraphy (地理 位 置 ) 、Language (语言 ) 。 


User Acquisiton。User Acquisition 是 用 户 来 源 的 相关 报告 ， 通过 外 部 应 用 推广 获得 的 用 户 来 源 数据 ， 包 括 Repotting (报告 ) 、Cteate Campaign (创建 广告 ) 。 


` Events。 事 件 是 开发 者 自 定 义 的 任何 目标 动作 ， 如 下 载 、 注 册 、 评 论 、 付 费 、 试 用 等 ， 


事件 追踪 的 定义 与 APP 的 商业 目标 相关 ; 事件 也 支持 漏斗 功能 ， 可 以 通过 事件 漏斗 监测 每 个 步骤 的 用 户 完成 情 


Errors。 Errors 报 告 显 示 了 所 有 的 错误 信息 ， 错 误 信息 常用 来 做 APP 技 术 改 进 和 用 户 体 验 提 升 ， 报 表 包 括 Crashes ( 勇 溃 ) 、Etrrors By Stack Trace (堆栈 跟踪 错误 ) 、Etrrors By Name (错误 名 称 ) 。 


* Technical。Technical 是 所 有 设备 信息 的 集成 报表 ， 显 示 了 用 户 设备 的 基本 属性 特征 ， 便 于 企业 有 针对 性 地 做 用 户 特征 分 析 及 APP 优 化 提升 。 报 表 包 括 All Devices (设备 ) 、All Catriers (运营 商 ) 、All 


Fitmwate Versions (固件 版 本 ) 、Etrors (错误 ) 。 


Manage。Manage 是 管理 控制 界面 ， 包 括 APP Info (APP 信 息 ) 、Versions (版 本 ) 、Segments ( 细 分 ) 、Events (事件 ) 、Alerts (预警 ) 、Permissions (权限 ) 、Advanced (高 级 ) 。 


(2) 数据 指标 


Flurry 的 数据 指标 基本 以 Session 和 User 为 单位 ， 这 两 个 指标 基本 获 盖 所 有 的 报表 ， 另 外 有 一 些 指标 是 针对 APP 开 发 的 新 度量 。 


.Sessions (会 话 ) : 一 个 应 用 从 启动 到 终止 被 称 为 一 个 会 话 。 会 话 跟 用 户 在 应 用 上 的 浏览 时 间 、 浏 览 页 面 数量 无 关 。 另 外 ， 如 果 用 户 在 离线 状态 下 使 用 APP， 数 据 会 先 保留 在 设备 上 ， 待 下 次 用 户 在 联 
网 的 环境 下 打开 APP， 数 据 会 发 送 到 Flutrty。 
Usefr (用户) : 应 用 可 以 跟踪 到 唯一 设备 识别 码 〈 因 平台 而 异 ) ， 不 同 的 设备 识别 码 被 当做 不 同 的 用 户 ， 因 此 APP 中 的 用 户 定 义 实 际 上 是 根据 设备 定义 的 。 


指 第 


. New Users 〈 新 用 户 ) : 一 次 使 用 应 用 程序 的 用 户 ， 用 户 是 通过 它们 的 唯一 设备 识别 码 ， 因 此 新 用 户 实 质 上 是 新 设备 数 。 所 有 APP 类 用 户 能 被 统计 到 的 前 期 与 网 站 统计 逻辑 类 似 ， 用 户 必须 打开 


APP 才 能 收集 用 户 信息 。 


因此 ， 下 载 之 后 没有 打开 的 用 户 不 会 被 统计 。 


:Active Users (活跃 用 户 ) : 指 在 选 定 周期 (日 、 周 、 月 等 ) 内 至 少 启动 过 一 次 应 用 程序 的 用 户 。 
Recent Usets (最 近 用 户 ) : 默认 情况 下 ， 最 近 7 天 内 至 少 启动 过 一 次 的 用 户 被 称 为 最 近 用 户 。 
. Retention (留存 ) : 留存 是 APP 的 特有 指标 ， 用 来 衡量 用 户 从 首次 启动 开始 ， 到 指定 时 间 内 是 否 再 次 打开 应 用 。 根 据 留存 时 间 的 不 同 可 分 为 次 日 留存 、 周 留存 、 月 留存 。 次 日 留存 是 用 户 第 一 次 启动 


后 ， 到 第 二 天 仍然 有 启动 的 用 户 数 ， 周 留存 是 指 用 户 第 


by » 
余 用 户 量 ， 它 是 


新 用 户 质量 的 重要 衡量 指标 。 


:One-Session Usets (一 次 会 话 用 户 ) : 


>、 :上 


指 自 从 安装 后 


一 次 局 动 后 ， 到 接 下 来 的 一 周 内 至 少 


启动 过 一 


次 的 用 户 数 ; 月 留存 逻辑 可 以 此 类 推 。 


留存 率 计算 的 基准 是 以 用 户 第 


一 次 启动 APP 开 始 计算 之 后 的 “ 剩 


和 
局 2、\ 


启动 过 一 


次 的 用 户 ， 


一 次 会 话 用 户 是 


是 衡量 新 用 户 质 


量 的 重要 指标 ， 该 指标 意味 着 用 户 只 有 一 次 启动 ， 用 户 质 


量 差 


量 雪 


Users Active on Only One Day (一 天 活跃 用 户 ) : 指 用 户 仅 在 安装 并 启动 当天 使 用 过 APP 的 用 户 数 (用 户 当天 使 用 多 次 或 一 次 ) 。 一 天 活路 用 户 跟 一 次 会 话 用 户 类 似 ， 都 是 衡量 新 用 户 质量 的 重要 指 
标 。 
:Clicks (点 击 次 数 ) : 用 户 点 击 广告 的 总 数 ， 用 于 衡量 站 外 广告 效果 ， 该 数据 从 外 部 获取 。 

* Installs (安装 量 ) : 用 户 点 击 广告 后 ， 安 装 并 居 动 应 用 的 数量 ， 该 指标 适用 于 用 户 获取 报表 ， 用 来 衡量 用 户 点 击 后 的 效果 。 

2.Flurry 的 功能 特色 

` 自 定 义 Dashboard: Flurry 支 持 定制 Dashboard 并 作为 系统 登录 后 的 着 陆 页 。 在 定制 过 程 中 ，Flurry 提 供 了 6 种 Dashboard 模 板 ， 包 括 Acquire and Retain、Ad-Supported Free App、Engagement、Flurry Classic、 


Free-to-Play App、Premium App。 同 时 ， 用 户 也 可 以 自 定义 Dashboard。 图 5-49 所 示 为 一 个 自 定 义 Dashboard 界 面 。 


= Dasliboards CREATE DASHBOARD 


Configure This Widget 
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| El Median Session Length 
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Events 


Manage Metrics Order: 


i. 3 Lasers In Comrran wnth this 
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J. 三 New Users 


图 5-49 ”Dashboard 自 定义 界面 


. 预警 : 预警 是 数据 系统 自动 工作 的 重要 组 成 部 分 ，Flutrty 支 持 通过 定制 预警 监测 的 关键 指标 。 图 5-50 所 示 为 Flutty 预 警 设置 界面 。Flutty 支 持 的 预警 指标 包括 New Users、Numbets of Sessions、Daily Active 


Users、Total Errors、Event Occurrences、User Triggeting Events， 以 及 规则 触发 条 件 支持 变化 、 增 加 、 下 降 等 ， 对 于 阅 值 可 以 指定 具体 的 数值 或 百分比 ， 触 发 时 间 可 指定 为 日 或 周 ， 如 图 5-50 所 示 。 


| Create New Alert 
Session Alert 
Email Me When Number of Sessions 


Changes By More Than 
Changes By More Than 


Increases By More Than a day 

Decreases By More Than 

Rises Above Create this alert for all projects 
Falls Below within company 数据 研究 与 商业 应 


用 磺 


or Cancel 


图 5-50 ”Flurry 预 警 设置 界面 


“ 高 级 细 分 : 高 级 细 分 支持 对 Date Range、Usage、Custom Events、Audience (Gendetr，Age Range，Language) 和 Location 进 


讲 一 定 
所 示 为 高 级 细 分 中 针对 Usage 的 定义 ， 分 为 重度 (Heavy) 、 常 规 (Regular) 、 不 频繁 (Infrequent) 三 种 ， 决 定 三 种 定义 的 维度 是 用 户 使 用 频率 ， 修 改定 义 范围 只 需 拖 慢 滑 块 即 可 。 


CREATE SEGMENT 
Edit Usage Segment [x | | 


Usage segments categorize your User base Into common activity groups, You can customize the 


Date Range parameters of these groups using the sliders below. 


New Usera Once you ve saveda segment YOU cannot return to edit these usage parameters. 


Usage 


Heavy 
Users active o 


Regular 


Users active 


Infrequent 
Users active a 


Infrequent 


图 5-51 ”Flurty 高 级 细 分 定义 


` Benchmatk 数 据 : 基于 在 APP 中 的 市 场 领 先 地 位 和 巨大 的 市 场 履 盖 ，EFlutry 在 部 分 报表 (报表 菜单 中 带 “B ”字样 的 都 提供 有 Benchmatk 数 据 ) 中 提供 了 与 Benchmatrk (标杆 ) 的 数据 对 比 ， 使 得 企业 在 分 
析 APP 数 据 时 不 仅 能 通过 细 分 、 对 比 、 渠 道 等 发 现 自 身 间 题 和 改进 建议 ， 还 能 通过 与 行业 标杆 对 比 获得 自身 数据 的 深入 洞察 。 图 5-52 所 示 为 Median Session Length 与 Benchmark 对 比 报表 ， 图 中 可 以 选择 相应 类 
别 与 标杆 数据 ( 蓝 色 线条 ) 进行 对 比 。 
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图 5-52 Median Session Length 与 Benchmatk 对 比 
全 总 Flurry 提 供 行 业 标杆 数据 的 前 期 是 需要 预 设 App Store ID 或 Android Market ID 等 ， 以 此 来 获得 该 应 用 所 属 的 应 用 分 类 。 


3.Flurry 系 统 的 优势 


. 功能 丰富 。Flurry 提 供 了 从 用 户 获取 到 最 早 应 用 的 整个 生命 周期 的 用 户 行为 监测 ， 并 可 以 自 定义 事件 拓展 监测 范围 ， 尤 其 是 其 Benchm 数 据 提供 了 行业 对 比 视角 ， 使 企业 通过 行业 数据 对 比 获得 自身 更 客 
观 的 数据 评估 ; 另外 ，Flurry 并 不 仅仅 限于 数据 统计 、 分 析 功 能 ， 还 提供 App Circle 广 告 、 推 广 平台 功能 。 


* 免费。Elurry 是 基于 SAAS 的 免费 工具 ， 企 业 只 需 注册 后 按照 实施 规则 将 SDK 谱 入 APP 即 可 实现 数据 跟踪 。 企 业 无 需 本 地 IT、 人 力 资源 和 后 期 的 维护 成 本 ， 投 入 成 本 仅 包含 人 力 技术 开发 。 


4.Flurry 系 统 的 不 足 


* 基于 国外 云端 的 SAAS 服 务 模 式 ，EFlutry 服 务 平台 架设 在 国外 ， 使 得 从 数据 采集 到 数据 应 用 的 核心 都 在 云端 运行 。 一 方面 会 导致 国内 访问 的 稳定 性 不 够 ， 在 线 访 问 速度 较 慢 ; 另 一 方面 如 果 客 户 集 中 于 
国内 市 场 ， 数 据 准确 性 和 可 靠 性 需要 能 够 得 到 保证 ， 尤 其 是 在 大 型 APP 用 户 并 发 情况 下 的 数据 响应 需要 得 到 重视 。 


` 缺少 中 文 界 面 。Flurty 只 有 英文 界面 ， 并 未 提供 中 文 界 面 ， 国 内 的 企业 在 使 用 过 程 中 会 面临 语言 和 使 用 上 的 障碍 。 


“ 无 电子 商务 跟踪 模块 。APP 跟 踪 只 有 使 用 情况 的 跟踪 ， 对 转化 的 跟踪 只 能 通过 事件 追踪 实现 ， 缺 少 类 似 于 Web 的 针对 电 商 的 跟踪 解决 方案 ， 使 其 应 用 领域 受到 局 限 。 


5.2.2 友 盟 


友 盟 是 2010 年 成 立 于 北京 的 APP 服 务 平台 ， 其 业务 范围 包括 四 个 移动 应 用 方向 : 开发 组 件 、 统 计 分 析 、 营 销 推广 和 盈利 服务 。 友 盟 是 目前 国内 免费 移动 应 用 数据 监测 的 领头 羊 ，2013 年 被 阿里 巴巴 收 
购 。 

友 盟 提供 针对 iOS、Android 和 Windows Phone 等 多 平台 服务 ， 基 于 SAAS 服 务 模式 ， 用 户 只 需要 注册 并 下 载 友 盟 SDK 集 成 到 APP 开 发 中 就 可 以 实现 针对 APP 的 数据 跟踪 及 其 他 服务 。 

友 盟 提供 的 服务 和 功能 与 Flurry 非 常 类 似 ， 两 者 相 比较 各 有 优 劣 : 


友 盟 在 数据 体系 的 完整 性 上 与 Flurry 有 一 定 的 差距 。(DFlurry 与 移动 应 用 市 场 对 接 较 好 ， 可 直接 通过 对 接 数 据 获得 站 外 点 击 及 后 续 数 据 ; 加 友 盟 无 法 提供 对 于 用 户 属性 和 喜好 的 分 析 维 度 如 Audience; @) 
友 盟 不 支持 自 定义 Dashboard; D 友 盟 不 支持 预警 ， 回 友 盟 不 支持 应 用 高 级 细 分 功能 。 


“ 友 盟 比 Flurry 更 懂 中 国 市 场 。 一 方面 友 盟 界面 比 Flurry 界 面 有 更 好 的 体验 ， 友 盟 整 个 界面 是 中 文 ， 且 界面 设计 符合 中 国 式 的 思维 ， 如 其 中 的 留存 率 数 据 ， 通 过 可 视 化 报表 显示 易于 理解 ， 如 图 5-53 所 示 ，; 


另外 ， 国 内 APP 可 以 借助 友 盟 的 分 发 渠道 进行 推广 ， 这 是 Flurry 无 法 实现 的 运营 支持 。 


首次 使 用 时 间 | 


2014-04-26 


2014-04-27 


2014-04-28 


2014-04-29 


2014-04-30 


图 5-53 友 盟 留存 率 数 据 报 表 


5.3 ”如 何 选择 网 站 分 析 工 具 


选择 网 站 分 析 工 具 ， 需 要 综合 解决 方案 的 能 力 、 产 品 易 用 性 、 功 能 丰富 性 、 增 值 服务 价值 和 费用 ， 更 重要 的 是 需要 结合 企业 自身 的 需要 有 效 评估 ; 否则 即使 工具 的 性 能 再 强大 ， 企 业 也 无 法 发 挥 其 真正 
的 价值 。 


5.3.1 整体 解决 方案 的 能 
整体 解决 方案 的 能 力 是 指 能 完全 与 其 他 工具 或 解决 方案 融合 提供 更 广泛 支持 的 能 力 。 整 体 解决 方 案 的 能 力 包括 两 部 分 : 一 是 整合 数据 ( 含 内 、 外 部 数据 跟踪 ) 系统 的 能 力 ;， 二 是 整合 运营 系统 的 能 
1. 整 合 数据 系统 的 能 力 
众所周知 ， 网 站 数据 只 是 企业 数据 的 一 部 分 。 从 网 站 数据 开始 ， 按 照 由 个 体 到 整体 的 数据 范畴 分 别 是 网 站 数据 、 运 营 数 据 、 业 务 数据 、 企 业 数 据 四 个 层次 。 
` 网 站 数据 : 以 网 站 (Web/WAP/APP) 为 数据 生产 环境 ,主要 是 与 站 内 流量 相关 的 数据 。 


` 运营 数据 : 围绕 运营 形成 的 数据 环境 ， 除 站 内 流量 数据 外 ， 还 包括 站 外 运营 数据 ， 如 营销 数据 、 线 下 数据 由 物流 配送 的 数据 等 ,不同 的 运营 范畴 定义 具有 不 同 的 数据 规模 。 运 营 范 畴 如 果 只 定义 为 围 
绕 网 站 端的 所 有 业务 动作 ， 可 能 只 包括 营销 、 运 营 、 用 户 体验 和 与 在 线 销售 相关 的 业务 ; 如 果 运 营 有 更 大 的 业务 范畴 可 能 还 包括 会 员 维 系 、 活 动 策划 、 产 品 规划 、 市 场 规划 等 。 


` 业务 数据 : 围绕 整个 业务 体系 形成 的 数据 环境 ， 除 运营 数据 外 ， 还 包括 运营 的 上 下 游 业务 部 门 数 据 ， 如 IT、HR、 管 理 、 监 察 等 体系 数据 ， 业 务 数 据 是 企业 所 有 业务 类 数据 的 总 称 。 


. 企业 数据 : 企业 数据 包含 所 有 企业 产生 的 业务 数据 、 财 务 数据 、 职 能 数据 等 ， 所 有 的 数据 构成 了 企业 的 大 数据 集合 ， 如 图 5-54 所 示 。 


图 5-54 企业 数据 范畴 


网 站 数据 只 占 企 业 整 体 数 据 的 一 小 部 分 ， 无 论 是 通过 外 部 数据 整合 到 网 站 分 析 系 统 之 内 ， 还 是 将 网 站 数据 整合 到 企业 数据 仓库 之 内 ， 网 站 分 析 工 具 的 整合 数据 系统 的 能 力 越 强 ， 越 容易 实现 数据 集成 以 
及 基于 整合 数据 的 完整 视角 。 


2. 整 合 运营 系统 的 能 力 


网 站 数据 发 挥 价值 的 方式 之 一 是 通过 与 数据 相关 的 从 业者 提供 数据 解读 ， 从 而 为 业务 策略 和 执行 提供 辅助 建议 ， 另 外 一 种 方式 是 通过 相关 系统 对 接 ， 直 接 通过 数据 驱动 的 方式 将 数据 价值 输入 业务 系 
统 ， 实 现 数据 的 自我 价值 。 


常见 与 网 站 分 析 工 具 集 成 的 运营 系统 包括 : 


. CRM。 通 过 网 站 流量 数据 国定 触发 ， 有 针对 性 的 完成 与 CRM 相 关 的 流程 。 如 针对 已 经 登录 并 将 产生 加 入 购物 车 但 放弃 购物 的 用 户 ， 网 站 分 析 工 具 将 数据 传输 到 CRM 中 ，CRM 根 据 预 设 条 件 进行 判断 执 
行 ， 如 有 针对 性 的 发 送 优惠 券 、 提 升 信息 价值 或 用 其 他 刺激 购买 方式 提高 购物 车 转化 率 。 


. 销售 系统 。 网 站 分 析 工 具 将 网 站 流量 数据 传输 到 销售 预测 系统 中 ， 销 售 预测 系统 根据 产品 的 浏览 趋势 、 用 户 属性 、 来 源 及 转化 率 数据 
库存 系统 ， 及 时 提醒 相关 采购 、 补 货 或 物流 方案 信息 。 


综合 


综合 评估 出 未 来 N 天 的 产品 销售 情况 ， 并 将 该 数据 传输 到 相关 的 


. 站 外 营销 系统 。 网 站 分 析 工 具 将 站 内 用 户 的 关键 行为 进行 采集 并 提取 特定 的 特征 ， 然 后 将 用 户 喜 好 信息 


言 息 反馈 到 营销 系统 ， 和 营销 系统 根据 此 信息 优化 站 外 投放 结构 、 素 材 和 其 他 营销 策略 。 
" 站 内 推荐 系统 。 网 站 分 析 工具 将 特定 数据 传输 到 站 内 推荐 系统 ， 站 内 推荐 系统 根据 用 户 行 为 有 针对 性 地 推荐 其 喜好 的 内 容 或 产品 。 


. 网 站 运营 系统 。 大 多 数 网 站 运营 系统 都 靠 人 工 以 手动 的 方式 调整 素材 、 内 容 等 ， 网 站 分 析 工 具 可 以 将 国定 广告 位 、 内 容 位 、 资 源 位 的 数据 回 传 到 网 站 运营 系统 中 ， 网 站 运营 系统 根据 数据 自动 调整 页 
面 展示 内 容 ， 以 提高 运营 效率 。 


可 


5.3.2 ”产品 易 用 性 
大 多 数 企 业 在 考虑 产品 易 用 性 时 只 考虑 了 网 站 分 析 工 具 使 用 的 业务 部 门 的 需求 ， 而 忽视 了 IT 部 门 的 需求 。 业 务 部 门 与 |T 部 门 对 网 站 分 析 工 具 易 用 性 的 关注 点 截然 不 同 。 
1.1T 部 门 关 注 产 品 易 实施 


大 多 数 情况 下 ，IT 部 门 往 往 是 企业 评估 网 站 分 析 工 具 时 的 重要 参与 者 ， 对 于 IT 部 门 来 说 ， 产 品 的 稳定 性 高 、 实 施 方便 、 技 术 开发 难度 小 、 数 据 安全 性 高 是 IT 部 门 关注 的 首要 因素 ， 对 于 SAAs 模 式 而 言 ， 
产品 易 实 施 是 其 最 重要 的 关注 点 。 整 个 网 站 分 析 项 目 从 计划 到 上 线 往往 要 耗费 大 量 的 人 力 成 本 ，IT 部 门 的 技术 开发 工作 往往 会 花费 许多 时 间 ， 容 易 实 施 既 能 上 线 的 技术 项 目 更 容易 得 到 IT 部 门 的 认 


例如 : 实现 页 面 热力 图 的 功能 ， 不 同 的 工具 有 不 同 的 解决 方案 。 有 的 工具 只 需要 一 段 通用 代码 ， 有 的 工具 需要 单独 标记 热力 图 参考 点 ， 有 的 工具 则 需要 将 全 页 面 元 素 1D 指 定 给 系统 相关 变量 才能 获得 可 
靠 的 热力 图 数据 。 对 IT 部 门 来 说 ， 自 然 希望 选择 第 一 种 实时 方案 。 


容易 实施 的 技术 方案 不 仅 能 减少 技术 开放 工作 量 从 而 保证 网 站 分 析 项 目 快速 落地 ， 还 可 以 减少 代码 过 多 导致 版 本 更 新 、 代 码 发 布 等 网 站 数据 采集 的 问题 。 
2. 业 务 部 门 关 注 产 品 易 使 用 


网 站 分 析 工 具 最 终 是 被 企业 中 的 关键 用 户 使 用 ， 包 括 网 站 分 析 师 、 业 务 人 员 、 产 品 经 理 、 交 互 设计 师 、 技 术 工 程 师 等 。 不 同 的 对 象 具有 不 同 的 数据 需求 ， 同 样 一 批 对 象 由 于 各 自 的 职位 不 同 也 有 不 同 的 
数据 侧重 点 。 


面 对 这 种 复杂 的 数据 需求 和 矩阵， 如 何 让 用 户 根 据 自 身 需 要 快速 、 有 效 、 深 入 的 得 出 结论 是 评估 一 款 网 站 分 析 工 具 的 重要 指标 。 


:以 用 户 角色 为 出 发 点 的 产品 定位 。 领 导 层 和 执行 层 看 的 数据 不 同 ， 领 导 层 关注 结果 、 趋 势 或 汇总 数据 ， 因 此 Dashboard、 汇 总 报表 必 不 可 少 ， 如 果 能 有 一 个 报表 能 涵盖 领导 日 常 关注 的 核心 指标 已 经 足 
够 了 ， 通 过 多 种 发 送 、 实 时 更 新 或 数据 对 接 产 生 更 多 的 附加 值 则 是 锦上添花 ; 执行 层 关注 原因 、 细 节 和 深入 探 完 ， 因 此 多 层级 下 钻 、 多 维度 交叉 分 析 、 用 户 群 体 细 分 、 路 径流 及 各 种 数据 分 析 和 挖 据 模 型 必 
不 可 少 。 


:以 用 户 应 用 为 导向 的 功能 设计 。 根 据 不 同 的 业务 模块 划分 数据 报表 ， 营 销 推 广 、 站 内 运营 、 用 户 体验 、 在 线 销 售 等 不 同业 务 模块 需要 不 同 的 报表 ， 报 表 需 要 单独 拆 分 呈现 ; 并 且 要 让 用 户 以 最 少 的 点 
击 操作 、 最 快 的 速度 找到 答案 ， 尽 量 减 少 业 务 方 思 考 数 据 在 哪 的 时 间 。 


辐 注 总 如 果 企 业 中 只 有 网 站 分 析 师 在 使 用 工具 ， 那 么 该 企业 的 数据 落地 通常 比较 差 一 一 从 不 使 用 工具 的 人 怎么 会 从 数据 中 得 到 了 驱动 建议 呢 ? 


5.3.3 ”功能 丰 语 性 
对 于 网 站 分 析 工 具 ， 其 功能 越 丰富 代表 可 通过 工具 获得 更 多 数据 视角 的 机 会 就 越 多 。 网 站 分 析 工 具 的 功能 可 以 分 为 四 类 : 基本 功能 、 自 定义 功能 、 高 级 功能 。 
1. 基 本 功能 
基本 功能 包括 : 基本 维度 、 基 本 指标 、APP 跟 踪 、WAP 跟 踪 、 用 户 权限 管理 、 热 力图 、Exce| 插 件 、 下 钻 功 能 。 
(1) 基本 维度 
基本 维度 包括 站 外 流量 来 源 、 站 内 访问 行为 、 电 子 商务 跟踪 、 用 户 数 据 等 。 
. 站 外 流量 来 源 : 站 外 所 有 来 源 渠 道 、 自 定义 跟踪 渠道 、 付 费 和 免费 搜索 引擎 及 关键 字 、 引 荐 链接 。 重 点 是 其 中 的 付费 渠道 跟踪 ， 涉 及 站 外 流量 的 标记 功能 。 
. 站 内 访问 行为 : 落地 页 、 退 出 页 、 搜 索 关 键 字 。 重 点 是 关键 字 ， 部 分 工具 不 支持 关键 字 跟 踪 。 


电子 商务 跟踪 : 目标 信息 、 订 单 信息 (订单 ID、 总 价值 、 优 患 信息 、 订 单 归 属 等 ) 、 商 品 信息 (商品 ID、 名 称 、 数 量 、 人 金额 等 ) 、 购 物 车 流程 (商品 查看 、 加 入 购物 车 、 填 写 订 单 、 提 交 订 单 ) 信 
息 。 该 维度 对 电子 商务 网 站 非常 重要 ， 所 有 功能 都 需要 具备 。 


. 用 户 数 据 : 地 域 (国家 、 省 、 市 ) 、 语 言 、 新 老 访客 、 忠 诚 度 、 回 访 频率 、 设 备 属 性 (浏览 器 、 操 作 系 统 内 、 设 备 名 称 、 设 备 分 类 ) 。 

(2) 基本 指标 

基本 指标 包括 UV、Visit、PV、 跳 出 率 、 新 访问 占 比 、 访 问 深度 、 平 均 访 问 时 间 、 订 单数 量 、 订 单价 值 、 优 惠 价值 、 产 品 数量 、 产 品 价值 、 电 子 商 务 转化 率 、 目 标 转化 率 、 事 件 转化 率 等 。 
(3) APP 跟 踪 

支持 APP 跟 踪 ， 包括 IOS (lphone、lpad) 、Android、Windows 系 统 平台 的 SDK 监 测 。 提 供 适 用 于 APP 的 跟踪 维度 和 指标 ， 如 一 次 性 访问 用 户 、 用 户 留存 、 活 跃 用 户 、 启 动 、 升 级 等 。 
(4) WAP 跟 踪 

针对 HTML 搭 建 的 WAP 网 站 以 及 不 支持 Js 的 WAP 网 站 ， 提 供 特 有 的 跟踪 方式 ， 如 1x1 硬 图 片 方式 。 

(5) 用 户 权限 管理 


通过 权限 控制 为 不 同 用 户 分 配 不 同 的 内 容 查看 权限 ， 报 表 查 看 权限 ， 数 据 查 看 权限 ， 报 表 新 建 、 修 改 、 删 除 、 更 新 权限 ， 系 统管 理 权 限 ， 自 定义 管理 权限 等 。 用 户 权 限 越 详细 ， 可 定制 的 灵活 性 越 高 ， 
就 越 能 满足 特殊 场景 的 需求 。 


(6) 热力 图 


包括 覆盖 热力 图 和 点 击 热力 图 两 种 形式 ， 点 击 热力 图 最 好 支持 自动 截图 ， 履 盖 热 力图 必须 支持 导出 功能 。 热 力图 跟踪 最 好 无 需 单独 配置 或 尽量 少 配置 。 


(7) Excel 揪 件 
通过 Excel 插 件 直接 连接 网 站 分 析 工 具 ， 同 时 可 以 实现 根据 数据 模板 刷新 数据 、 数 据 报 表 导 出 、 数 据 定时 发送 等 。 
(8) 下 外 功能 


通过 报表 的 下 钻 功能 分 析 不 同 数据 间 的 关联 关系 ， 最 少 支 持 一 层 下 钻 ， 层 次 越 多 越 好 。 


DD 


. 自 定义 功能 


(1) 自 定义 维度 跟踪 

提供 自 定义 维度 跟踪 功能 ， 便 于 根据 业务 需求 做 特定 监测 ， 数 量 越 多 越 好 。 

(2) 自 定义 事件 跟踪 

提供 自 定 义 事件 跟踪 ， 可 满足 特定 事件 的 跟踪 需求 ， 如 下 载 、 注 册 、 搜 索 、 登 录 等 ， 数 量 越 多 越 好 。 

(3) 自 定义 指标 跟踪 

根据 业务 需求 自 定义 数据 的 指标 跟踪 ， 如 跟踪 搜索 结果 返回 数量 、 购 物 车 内 用 户 输入 的 产品 数量 等 ， 数 量 越 多 越 好 。 


(4) 自 定义 计算 指标 


根据 已 有 指标 通过 综合 运算 (+、 - 、x、=+) 得 出 新 的 指标 ， 如 果 支 持 带 () 的 优化 级 或 函数 运算 则 功能 更 强大 ， 数 量 越 多 越 好 。 

(5) 自 定 义 数据 分 类 

通过 数据 分 类 ， 将 零散 的 数据 划分 成 指定 的 类 别 ， 如 页 面 内 容 分 类 、 产 品 分 类 、 推 广 渠道 分 类 、 事 件 分 类 、 目 标 分 类 等 。 支 持 自动 匹配 规则 和 数据 对 照 表 ， 或 通过 代码 实施 进行 数据 分 组 。 
(6) 自 定义 报表 

根据 需求 任意 定制 维度 和 指标 并 保存 报表 ， 以 后 每 次 只 需 查 看 该 报表 即 可 。 

(7) 自 定义 书签 

将 系统 默认 报表 保存 到 书签 ， 方便 在 日 常 工作 中 直接 点 击 查 看 。 

(8) 自 定义 Dashboard 


将 已 有 的 数据 报表 或 元 素 (趋势 图 、 饼 图 、KPI、 积 分 卡 、 地 理 位 置 图 ) 添加 到 Dashboard， 并 可 指定 为 登录 落地 页 ，Dashboard 最 好 具有 发 送 功能 ， 可 定时 发 送 给 相关 人 员 。 


(1) 标签 管理 器 

通过 标签 管理 器 管理 网 站 分 析 系 统 的 跟踪 代码 ， 标 签 管理 器 的 触发 规则 、 条 件 控制 、 阅 值 等 越 灵活 越 好 。 

(2) 跨 域 跟踪 

支持 跨 子 域 和 跨 项 级 域 的 跟踪 ， 支 持 第 一 方 Cookie 和 第 三 方 Cookie 选 择 。 

(3) 跨 设 备 跟踪 

提供 跨 Web/WAP/APP 用 户 跟 踪 并 识别 为 唯一 用 户 功 能 ,支持 登录 的 实名 用 户 (UserID) 跟踪 及 匿名 用 户 (唯一 用 户 识 别 标识 ) 的 跟踪 。 
(4) 订单 归 因 功能 


订单 归 因 模型 包括 最 后 进入 渠道 (归属 最 后 渠道 ) 、 最 初 进入 渠道 (归属 最 初 渠道 ) 、 根 据 位 置 综 合 评估 (根据 位 置 设置 权重 ， 越 细 化 越 好 ) 、 时 间 衰 减 (根据 设置 的 时 间 归 属 ) 、 线 性 模型 (平均 归 
等 ， 订 单 归 因 模型 越 多 、 配 置 越 简单 越 好 。 


到 


(5) A/B 测 试 


系统 最 好 支持 集成 A/B 测 试 及 多 变量 测试 功能 ， 测 试 部 署 和 配置 过 程 简 单 ， 测 试 逻 辑 可 灵活 控制 ， 包 括 测试 开始 时 间 、 测 试 样 本 、 不 同 版 本 的 样本 分 布 、 测 试 目标 、 测 试 结果 应 用 等 。 


通过 全 站 的 路 径 功能 ， 包 括 站 外 渠道 路 径 、 站 内 页 面 路 径 、 搜 索 词 路 径 、 目 标 路 径 、 事 件 路 径 等 ， 既 能 支持 细 分 数据 路 径 ， 又 能 支持 汇总 数据 路 径 ; 数据 路 径 长 度 至 少 为 3 级 ， 越 长 越 好 。 
(7) 漏斗 功能 

支持 全 站 页 面 、 事 件 、 目 标 之 间 的 漏斗 分 析 ， 通 过 漏斗 查看 用 户 对 特定 目标 的 完成 和 流失 情况 ， 最 好 能 支持 不 同 分 析 维 度 之 间 的 混合 漏斗 分 析 。 

(8) 数据 整合 能 力 


一 是 外 部 数据 整合 到 网 站 分 析 工 具 内 的 能 力 ， 二 是 将 网 站 数据 导入 企业 数据 仓库 的 能 力 ， 具 体 包括 导入 /导出 方式 (Excel、Json、SOAP、Data Feed、Datawarehouse) 、 数 据 限制 (每 个 文件 最 大 
数据 记录 数 ) 、 频 率 限 制 (每 天 同步 次 数 ) 、 开 发 工作 量 (API 对 接 难 度 ) 、 数 据 结构 化 及 规范 程度 (数据 仓库 结构 、 语 法 和 规则 ) 等 。 


(9) 实时 数据 
提供 单独 的 实时 报表 或 产品 ， 实 时 数据 的 可 选 时 间 范 围 至 少 要 提供 到 当天 ， 最 好 能 提供 数据 对 比 功能 ， 并 可 定制 实时 Dashboard。 实 时 数据 可 查看 的 维度 和 指标 应 尽量 丰富 ， 数 据 延 时 程度 应 尽量 低 。 
(10) 预警 功能 


针对 预 设 条 件 设 定 阔 值 对 出 现 异 常 的 数据 进行 预警 提醒 ， 支 持 通 过 邮件 、 短 信 等 形式 发 送 预警 信息 到 指定 联系 人 列表 或 联系 人 。 预 警 规 则 灵活 ， 可 针对 所 有 维度 、 所 有 指标 指定 固定 阔 值 或 靖 值 变化 百 
分 比 ， 数 据 对 比 时 间 应 至 少 提供 日 、 周 、 月 三 个 维度 的 数据 以 供 参照 。 


(11) 自动 发 送 服务 
通过 邮件 、 短 信 等 形式 发 送 自 定义 报告 、 数 据 预 警 、 账 号 变化 信息 、 异 常 登 录 信 息 等 。 
5.3.4 增值 服务 价值 


1. 为 什么 要 买 服务 


(1) 部 署 和 实施 需求 


企业 购买 高 级 网 站 分 析 工 具 的 初期 ， 对 网 站 分 析 工 具 整 个 流程 和 机 制 了 解 较 少 ， 此 时 需要 专业 的 技术 人 员 和 商业 顾问 的 帮助 。 一 方面 ， 网 站 分 析 工 具 项 目 是 公司 级 大 项 目 ， 整 个 工作 涉及 公司 的 各 个 业 
务 和 IT 部 门 ， 公 司 部 门 间 的 统筹 协作 尤为 重要 ; 另 一 方面 ， 出 于 数据 完整 性 、 安 全 性 、 稳 定性 的 需要 ， 企 业 前 期 需要 尽量 将 数据 采集 、 处 理 和 报告 的 细节 考虑 周全 ， 该 工作 需要 经 验 丰富 的 人 员 协 助 进行 。 
另外 ， 某 些 网 站 分 析 系 统 的 功能 需要 经 过 认证 的 特殊 权限 才能 开放 使 用 ， 否 则 有 钱 也 无 法 工作 ， 比 如 Adobe Analytics 需 要 资质 认证 才能 使 用 “处 理 规则 ”功能 ， 否 则 该 功能 会 处 于 不 可 用 的 状态 。 


(2) 专项 沟通 和 培训 需求 


服务 提供 商 的 咨询 服务 可 以 使 企业 快速 进入 网 站 数据 的 正常 工作 流程 ， 如 工作 机 制 、 协 作 流 程 等 都 能 帮助 企业 在 前 期 少 走 弯路 ， 关 于 系统 本 身 的 知识 培训 也 是 提高 企业 内 部 网 站 数据 工具 应 用 能 力 的 重 
要 方式 。 


对 于 网 站 分 析 工 具 定 期 发 布 的 新 功能 ， 服 务 商 大 都 能 在 第 一 时 间接 触 到 并 获得 相关 的 技术 和 应 用 信息 ， 这 些 信息 可 以 快速 传递 到 企业 内 部 进行 应 用 可 减少 信息 不 对 称 的 情况 发 生 。 


服务 咨询 商 的 行业 经 验 是 一 个 企业 永远 无 法 具备 的 宝贵 财务 。 因 此 在 合作 过 程 中 ， 通 过 服务 商 提供 的 行业 经 验 交流 ， 企 业 可 以 学 习 并 掌握 其 他 企业 的 数据 “游戏 规则 ” ， 这 是 咨询 服务 最 有 价值 的 支撑 


(3) 数据 整合 和 开 友 需求 


大 多 数 付 费 网 站 的 分 析 工 具 都 支持 一 定 的 二 次 开发 ， 服 务 咨 询 商 对 于 开发 过 程 中 的 技术 问题 更 为 了 解 ， 甚 至 部 分 服务 商 已 经 实现 了 部 分 的 开发 工作 ， 只 需要 企业 应 用 即 可 实现 开发 需求 ， 这 既 能 减少 企 
业 的 时 间 、 人 力 和 物力 成 本 ， 又 能 最 大 化 的 提高 网 站 分 析 工 具 的 价值 。 


2. 服 务 要 素 的 考察 点 

(1) 日 常 支持 

日 常 支持 会 涉及 部 署 、 沟 通 、 培 训 等 各 方面 的 问题 ， 日 常 支持 的 方式 (邮件 、 电 话 、 进 驻 企 业 ) 、 响 应 效率 (2 小 时 答复 、7x24 还 是 其 他 ) 等 都 是 重要 的 参考 因素 。 
(2) 原 厂 服务 团队 


大 多 数 国 外 网 站 分 析 工 具 都 是 通过 代理 商 提 供 产品 销售 和 服务 来 支持 的 ， 但 由 于 各 方面 的 原因 ， 代 理 商 团队 很 可 能 无 法 提供 高 质量 的 咨询 服务 。 如 果 有 上 原 厂 服务 团队 的 支持 ， 无 论 是 本 地 还 是 远程 沟 
通 ， 将 更 有 利于 问题 的 解决 。 


(3) Local 办 公 和 本 地 化 作业 
Local 办 公 是 指 在 中 国有 办 公 室 ， 本 地 化 作业 是 指 根据 企业 的 需求 入 驻 企业 内 部 共同 推进 该 项 目 ， 这 两 方面 是 评价 一 个 网 站 分 析 工 具 服务 商 本 地 化 的 重要 参考 标准 。 在 开展 项 目 工 作 尤 其 是 网 站 部 署 和 应 
用 前 期 ， 通 常 需要 以 入 驻 的 形式 协助 企业 建立 完整 的 网 站 分 析 工 作 流 程 。 本 地 化 作业 可 最 大 限度 满足 企业 内 部 的 需求 。 


5.3.5 “价格 和 费用 


网 站 流量 分 析 工 具 的 价格 通常 包括 三 部 分 : 流量 费用 、 功 能 费用 和 服务 费用 。 
` 流量 费用 。 除 了 Google Analytics Premium 外 ， 其 他 所 有 的 网 站 分 析 工 具 都 是 基于 流量 付费 的 。 流 量规 模 决 定 了 付费 区 间 ， 流 量 越 高 ， 整 体 价格 越 高 (单价 其 实 更 低 ) 。 


.功能 费用 。 支 付 流量 费用 之 后 ， 网 站 分 析 工 具 的 大 部 分 功能 都 可 以 使 用 ， 但 菜 些 功能 模块 可 能 需要 额外 付费 。 在 选择 网 站 分 析 工具 时 ， 需 要 确认 是 否 所 有 的 产品 和 功能 特征 都 可 用 ， 以 免 在 后 期 使 用 
时 造成 不 必要 的 麻烦 。 


“ 服务 费用 。 服 务 费 用 通常 与 以 上 两 种 费用 打包 结算 ， 国内 目前 很 少 按时 间 付 费 ， 这 也 是 网 站 分 析 咨 询 服 务 价值 低 的 一 种 体现 。 


网 站 分 析 工 具 的 选择 ， 一 定 要 结合 企业 的 需求 (包括 短期 需求 、 中 期 需求 和 长 期 需求 ) 、 预 算 、 实 现 目 标 等 自身 的 情况 ， 并 对 服务 商 的 产品 、 服 务 、 预 期 产 出 价值 等 因素 进行 综合 评估 。 


5.4 本章 小 结 


本 章 介 绍 了 不 同 网 站 分 析 工 具 和 移动 分 析 工 具 的 相关 功能 与 特征 及 选择 等 知识 ， 需 要 读者 重点 掌握 的 知识 点 如 下 : 
. 不 同 工 具 的 组 成 及 基本 功能 ， 重 点 是 其 数据 分 析 维 度 和 视角 ; 
. 选择 网 站 分 析 工 具 时 需要 注重 的 几 大 因素 ， 重 点 是 适合 企业 需求 。 
关于 各 种 工具 更 多 的 详细 功能 及 使 用 介绍 ， 有 以 下 几 种 方法 可 供 参 考 : 
“ 所 有 工具 的 帮助 中 心 都 是 免费 且 最 好 的 学 习 资 源 ; 
. 国内 关于 工具 的 介绍 博客 也 有 很 多 ， 如 “ 蓝 鲸 的 网 站 分 析 笔 记 ” 主 要 介绍 Google Analytics，“ 网 站 分 析 在 中 国 ” 介 绍 了 非常 多 的 关于 网 站 分 析 的 思路 等 ; 
. 网 站 分 析 技 术 起 源 于 国外 ， 国 外 的 博客 也 是 非常 重要 的 前 沿 知 识 阵地 ， 如 Avinash Kaush 水 的 博客 (英文 ) http://www.kaushik.net/avinash/。 
. 读书 是 进步 的 捷径 。《 流 量 的 秘密 : Google Analytics 网 站 分 析 与 优化 技巧 (第 3 版 ) 》 (数字 曲 奇 翻译 组 译 ) 已 出 版 了 第 三 版 ， 有 英文 基础 的 读者 建议 直接 阅读 英文 版 的 《Web Analytics 3.0》 (作者 : 
Brian Clifton) 。 
关于 网 站 分 析 工 具 的 选择 : 


* 对 企业 来 讲 ， 选 择 工具 之 前 首先 要 把 免费 工具 用 好 (很 难 相 信 一 个 不 会 使 用 免费 工具 的 企业 会 把 付费 工具 用 出 价值 ) ， 在 用 好 免费 工具 的 基础 上 再 针对 企业 的 实际 情况 考虑 付费 工具 。 最 重要 的 是 工 
有 具 本 身 无 法 产生 价值 ， 网 站 分 析 师 即 人 是 产生 价值 的 唯一 因素 ， 企 业 在 重金 购买 工具 的 同时 又 会 用 多 少 价值 投 到 网 站 分 析 师 身上 呢 ? 


对 个 人 来 讲 ， 通 常会 选择 免费 网 站 分 析 工 具 作为 学 习 和 个 人 实践 的 手段 。 对 于 大 多 数 个 人 网 站 ，Google Analytics 的 功能 已 经 足够 使 用 了 ， 其 次 开源 的 PIWIK 也 可 以 作为 参考 学 习 使 用 。 不 同 的 网 站 分 


最 关键 的 因素 还 是 要 看 个 人 的 能 如 何 将 不 同 的 工具 功能 与 企业 的 实际 需求 相 结合 。 


析 工 具 虽 然 各 有 其 特点 ， 但 工具 永远 是 次 要 的 


第 6 草 ”网 站 数据 整合 的 万 法 


网 站 数据 作为 企业 数据 的 重要 组 成 部 分 ， 记 录 了 大 量 的 客户 和 潜在 客户 的 所 有 网 站 行为 信息 。 网 站 数据 的 巨大 价值 是 所 有 用 户 (即使 还 只 是 潜在 用 户 ) 的 行为 都 是 可 跟踪 、 可 回溯、 可 量化 、 可 分 析 
的 ， 并 且 分 析 结 果 可 以 直接 应 用 到 相关 业务 节点 。 这 直接 弥补 了 传统 企业 数据 局 限于 已 经 完成 特定 转化 如 付款 、 交 易 之 后 的 数据 短 板 ， 使 得 企业 的 业务 对 象 的 所 有 行为 形成 数据 闭环 ， 可 以 建立 基于 完整 闭 
环 的 业务 认 知 。 


本 章 将 围绕 网 站 数据 整合 的 相关 话题 ， 介 绍 网 站 数据 整合 对 企业 不 同 对 象 的 重大 意义 、 网 站 数据 整合 的 范畴 和 数据 点 如 何 定义 ， 以 及 网 站 数据 的 整合 方法 和 最 佳 实践 等 。 


6.1 ”网 站 数据 整合 的 意义 


1. 提 高 决策 层 的 决策 效率 
很 多 企业 的 领导 层 和 决策 层 在 接收 数据 的 反馈 信息 时 ， 经 常 面临 以 下 问题 : 
. 数据 报表 太 多 且 分 散 ， 很 难 及 时 获得 关键 信息 ; 
“ 不 同 报表 的 数据 不 一 致 ， 无 法 确认 准确 的 数据 结果 ; 
“ 数据 及 时 性 差 ， 难 以 及 时 监控 到 业务 状况 ; 
. 决策 时 无 有 效 基 础 数据 及 结论 ， 只 有 缺乏 体系 的 数字 陈列 ; 
* 缺乏 有 效 的 考核 业绩 的 支持 机 制 。 
这 些 问 题 导 致 了 企业 决策 层 很 难 从 数据 中 及 时 获得 相应 信息 以 辅助 决策 支持 ， 因 此 得 不 到 企业 决策 层 认可 的 数据 体系 很 难 发 挥 实质 性 作用 。 
基于 整合 后 的 统一 数据 源 ， 很 容易 提供 统一 的 数据 以 供 决策 ; 数据 由 于 减少 了 不 同系 统 、 不 同 产 品 、 不 同 报表 甚至 不 同 指标 间 的 相互 转换 ， 节 省 了 大 量 的 中 间 环 节 而 提高 了 数据 的 实时 性 ; 基于 整合 数 
据 ， 所 有 业务 信息 流 前 后 贯穿 ， 业 务 间 的 相互 关系 及 对 关键 目标 的 作用 一 目 了 然 ， 无 论 是 基于 目标 的 KPI 考 核 还 是 基于 过 程 的 评估 都 可 以 做 到 有 的 放 矢 。 
2. 深 化 业务 层 的 商业 洞察 


企业 数据 整合 前 ， 业 务 部 门 在 开展 数据 相关 工作 时 常常 工作 效率 低 、 反 馈 效 果 差 ， 表 现在 所 需 报 表 及 数据 难以 获取 、 报 表 制 作 过 于 烦琐 、 现 有 工具 和 认识 难以 深层 次 分 析 业 务 异常 原因 、 不 同 部 门 间 的 
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数据 结果 难以 有 效 共享 等 。 

因此 ， 业 务 部 门 往往 耗费 大 量 的 时 间 在 数据 提取 、 整 理 、 汇 总 和 制作 上 ， 缺 乏 时 间 做 更 深入 的 数据 洞察 和 价值 提炼 工作 ; 即使 得 出 结论 又 由 于 不 同 部 门 间 缺 乏 统一 的 度量 和 定义 而 无 法 直接 共享 ， 仍 然 
需要 重新 梳理 数据 。 

3. 降 低 1T 的 数据 维护 成 本 


对 IT 部 门 来 讲 ， 数 据 分 散 意 味 着 不 同系 统 间 的 数据 无 法 关联 ， 站 外 营销 系统 数据 、 网 站 流量 系统 数据 、CRM 数 据 、 销 售 数据 、 物 流 数据 、 仓 储 库存 数据 等 都 是 孤立 存在 于 各 个 系统 的 分 散 数 据 个 体 ， 这 
些 个 体会 直接 导致 数据 孤岛 的 出 现 。 


随 着 企业 业务 的 不 断 发 展 及 业务 人 员 数 据 意识 的 提高 ， 基 于 数据 的 采集 、 存 储 、 应 用 需求 不 断 调整 ， 分 散 式 的 数据 难以 应 付 ; 数据 报表 的 容量 不 断 增加 ， 对 IT 的 系统 性 能 (MO、 读 表 速 度 和 效率 、 响 应 
时 间 ) 、 维 护 成 本 (升级 、 备 份 、 更 新 ) 等 要 求 不 断 提 高 ， 客 观 上 也 提高 了 IT 运 维 成 本 。 


另外 ， 数 据 分 散 还 会 导致 企业 数据 安全 性 较 差 ， 不 同 的 数据 由 不 同 用 户 控制 ， 缺 乏 企业 级 数据 安全 管理 和 风险 控制 ， 这 对 企业 来 讲 是 巨大 的 安全 隐患 。 


6.2 ”网 站 数据 整合 的 沁 畴 


网 站 数据 整合 的 范畴 指 的 是 整合 的 数据 范围 ， 从 数据 在 企业 中 不 同 的 支持 作用 来 看 ， 数 据 整 合 范畴 包括 业务 数据 整合 、IT 数 据 整 合 和 职能 数据 整合 ， 除 了 企业 内 部 数据 外 ， 还 包括 企业 外 部 数据 ， 如 市 
场 数据 、 行 业 数 据 、 竞 争 对 手数 据 等 。 


6.2.1 ”业务 数据 整合 


业务 数据 整合 的 目的 是 将 所 有 围绕 公司 业务 上 下 游 的 数据 整合 到 一 起 ， 形 成 完整 的 业务 流 数据 体系 。 以 销售 类 电子 商务 网 站 运作 流程 为 例 ， 用 户 从 站 外 推广 渠道 进入 网 站 ， 在 企业 网 站 完成 在 线 订 单 ， 
之 后 跳 转 到 第 三 方 支付 平台 付款 ， 企 业 通过 线 下 物流 配送 将 商品 送 到 用 户 手 中 完成 收 货 ， 整 个 流程 如 图 6-1 所 示 。 


站 外 营销 数据 企业 网 站 数据 


物流 数据 


党 三 方 网 站 数据 


图 6-1 电子 商务 基本 业务 流程 图 


以 上 流程 图 是 围绕 用 户 的 业务 数据 整合 ， 涉 及 网 站 营销 数据 、 网 站 流量 数据 、 线 上 支付 数据 、 线 下 物流 数据 等 ， 除 此 以 外 还 可 能 包括 网 站 运营 数据 、 企 业 销 售 数据 、 线 下 会 员 数 据 、 呼 叫 中 心 数据 、 仓 
储 数据 等 。 


1. 网 站 营销 数据 


网 站 营销 数据 是 指 企业 在 站 外 通过 各 种 推广 方式 投放 广告 或 合作 ， 以 实现 用 户 品牌 认 知 、 广 告 宣传 或 其 他 转化 为 目标 所 形成 的 数据 。 网 站 营销 数据 的 来 源 是 站 外 各 个 投放 渠道 服务 商 ， 包 括 广 告 数 据 、 
SEM 数 据 、CPS 数 据 、BD 数 据 、EDM 数 据 、 社 会 化 媒体 数据 、SEO 数 据 等 。 


(1) 广告 数据 


告 是 大 多 数 企 业 投入 费用 最 多 的 推广 方式 之 一 ， 其 推广 效果 也 更 受 人 关注 。 广 告 数 据 是 指 以 图 片 、 视 频 、 动 态 Flash 甚 至 文字 等 形式 对 用 户 展现 的 推广 方式 。 不 同 公司 对 广告 范围 的 定义 不 同 ， 但 基本 
上 定义 的 核心 都 是 以 “展示 ”为 主 。 


广告 数据 按 来 源 分 有 两 种 : 第 一 种 是 通过 代理 商 获 取 ; 第 二 种 是 直接 从 投放 终端 获取 。 


` 通过 代理 商 获 取 : 国内 大 多 数 优 质 广告 资源 都 被 代理 商 垄 断 ， 大 型 企业 通常 通过 代理 商 投 放 广 告 。 根 据 服务 程度 的 不 同 ， 代 理 商 的 职责 可 能 包括 全 案 策划 、 媒 体 购 买 、 媒 体 执行 、 媒 体 效 果 评 估 四 部 
分 。 通 过 代理 商 投放 广告 时 都 可 以 从 代理 商 处 获得 投放 数据 。 


` 通过 投放 终端 获取 : 部 分 独立 售卖 的 媒介 资源 以 及 有 资源 的 大 型 企业 也 会 直接 跟 媒 介 谈 判 进行 媒介 购买 ， 此 时 数据 可 直接 从 投放 媒介 的 终端 获取 。 
不 同 的 广告 系统 提供 不 同 的 广告 数据 维度 ， 通 用 广告 系统 的 数据 维度 包括 渠道 信息 、 媒 介 信息 和 促销 信息 。 


. 渠道 信息 。 用 来 标识 渠道 来 源 、 细 分 渠道 、 付 费 形 式 等 信息 。 如 果 在 Sina 投 放 广告 ， 则 渠道 来 源 为 Sina; 如 果 在 Sina 上 有 多 个 媒体 资源 ， 则 需要 细 分 跟踪 到 每 个 媒体 资源 。 除 渠道 信息 外 ， 通 常 还 包括 
付费 方式 ， 如 CPD ( 包 段 广告 ， 如 包 天 、 包 月 等 ， 门 户 的 优质 资源 大 多 为 该 形式 ) 、CPC (接点 击 付费 ， 如 谷歌 网 盟 中 可 以 按 点 击 付费 ) 、CPA ( 按 动 作 付费 ， 预 先 定义 动作 如 注册 、 下 载 等 ) 、CPM ( 千 次 


展示 付费 ) 等 ， 展 示 类 广告 大 多 以 CPD、CPM 和 CPC 为 主 。 


* 媒介 信息 。 用 来 标识 投放 媒介 的 具体 信息 ， 包 括 媒介 位 置 ( 首 屏 、 底 部 等 ) 、 广 告 形式 〈 弹 窗 、 背 投 、Bannet、 按 钮 、 画 中 画 、 贴 片 等 ) 、 广 告 尺 寸 (1000 X90 像素 、120X240 像 素 等 ) 、 广 告 排 期 
(广告 投放 的 起 止 时 间 ) ， 这 些 对 广告 效果 评估 至 关 重 要 。 在 其 他 因素 不 变 的 条 件 下 ， 首 屏 的 广告 效果 通常 比 二 三 屏 的 好 ， 弹 窗 、 背 投 等 异形 广告 更 引 人 注 意 ， 大 尺寸 广告 比 小 尺寸 广告 容易 得 到 关注 ， 广 
告 时 间 对 广告 效果 的 影响 更 为 明显 : 工作 日 比 休息 日 流量 更 多 ， 上 午 十 点 、 下 午 三 点 、 了 晚上 十 点 是 一 天 中 的 三 个 流量 高 峰 。 


* 促销 信息 。 用 来 记录 当前 广告 的 投放 内 容 ， 如 广告 可 能 包括 品牌 推广 类 、 商 品 推 广 类 、 促 销 宣 传 类 等 ， 其 内 容 包括 广告 活动 (标识 活动 名 称 ) 、 广 告 主题 〈 标 识 活动 的 主题 ) 、 广 告 商品 (广告 中 是 
否 有 爆 款 和 标杆 产品 ) 、 广 告 卖 点 (价格 、 折 扣 类 信息 ) 。 促 销 信 息 在 媒介 信息 的 基础 上 ， 当 广告 展现 给 用 户 后 ， 直 接 决 定 了 用 户 的 点 击 欲 望 。 


除了 以 上 标准 信息 外 ， 部 分 系统 还 可 能 提供 更 深入 的 数据 维度 ， 如 针对 人 群 定位 投放 的 某 些 媒体 会 提供 投放 用 户 的 基本 属性 ， 如 性 别 、 年 龄 段 、 爱 好 、 网 站 域 、 主 题 域 等 ; 基于 竞价 的 广告 媒介 会 提供 
竞价 排名 、 轮 播 数 、 展 示 时 长 、 出 价 策略 、 优 化 策略 、 广 告 规则 等 。 


不 同 的 广告 系统 提供 不 同 的 广告 数据 指标 ， 通 用 的 广告 系统 数据 指标 包括 费用 指标 和 效果 指标 两 类 。 

-费用 指标 。 包 括 广 告 旨 用 情况 ， 如 总 费用 、 基 于 细 分 渠道 和 位 置 的 费用 、 基 于 点 击 的 费用 CPC、 基 于 曝光 的 费用 CPM、 基 于 转化 的 费用 CPA 等 。 

` 效果 指标 。 包 括 两 层 意义 : 第 一 层 是 站 外 曝光 类 指标 ， 包 括 曝光 量 、 点 击 量 以 及 CTR; 第 二 层 是 站 内 转化 效果 指标 ， 如 每 次 点 击 回报 、 每 次 转化 收益 等 。 
全 示 和 化 关 效果 指标 需要 在 站 内 相应 的 转化 页 面部 署 相应 的 代码 才能 实现 。 

(2) SEM 数 据 


SEM 即 搜索 引 警 曹 销 ，SEM 几 乎 是 所 有 企业 线 上 推广 的 必 备 方式 ，SEM 的 特点 是 投放 相对 精准 、 投 入 产 出 效果 直观 可 控 、 操 作 方 式 灵活 。 国 内 的 SEM 主 要 集中 在 百度 ， 其 次 是 360。SEM 的 数据 来 源 跟 
广告 数据 类 似 ， 既 可 以 直接 从 搜索 引 警 获取， 也 可 以 通过 代理 服务 商 获 取 。 
SEM 维 度 方面 ， 除 了 具备 广告 的 基本 维度 外 ， 还 有 一 些 SEM 数 据 的 特殊 维度 。 
* 账户 结构 : 普通 账户 结构 分 为 账户 、 广 告 计划 、 广 告 组 和 关键 字 四 级 ， 大 型 代理 商 在 其 主 账 户 之 下 还 会 增加 一 个 子 账 户 的 入 口 ， 即 可 分 为 五 级 。 
:账户 信息 : 账户 地 域 限制 (只 针对 特定 地 区 ) 、 广 告 履 盖 网 络 (搜索 网 络 和 展示 广告 网 络 ) 、 每 日 总 费用 (日 费用 限制 ) 等 。 


* 广告 计划 信息 : 广告 计划 、 状 态 、 高 级 地 理 位 置 (适用 于 谷歌 Adwords 搜 索 网 络 ， 包 括 通过 地 理 位 置 定 位 、 搜 索 意图 定位 或 两 者 结合 使 用 ) 、 广 告 投放 时 间 ( 周 、 天 、 时 段 控制 ) 、 广 告 投放 方式 《 标 


高 
准 、 加 速 ) 、 轮 换 显 示 (均匀 展示 还 是 更 多 展示 效果 好 的 广告 ) 、 频 次 上 限 ( 仅 谷歌 Adwords 支 持 频 次 上 限 设 置 ， 频 次 上 线 设 置 适 用 于 CPM 广 告 ) 等 。 


* 广告 组 信息 : 包含 广告 组 、 状 态 、 关 键 字 信息 、 定 位 条 件 (关键 字 、 网 站 、 特 定 主题 、 特 定 人 群 等 ) 、 投 放 设 备 〈 计 算 机 、 手 机 ) 、 创 意 展现 类 型 、 附 加 创意 等 。 


` 关键 字 信 息 : 包含 关键 字 、 状 态 、 匹 配 信息 (匹配 方式 和 匹配 结果 ) 、 对 应 的 广告 素材 信息 、 否 定 关键 字 、 关 键 字 质 量 等 。 
SEM 指 标 除 了 与 广告 类 似 的 指标 外 ， 还 包括 : 

:出价 信息 。 默 认 出 价 、 出 价 浮动 规则 、 最 低 出 价 、 平 均 点 击 价格 等 。 

“ 效果 数据 。 无 效 点 击 次 数 、 平 均 排 名 、 置 左 率 等 。 
另外 ，Google Adwords 还 提供 相对 点 击 率 、 通 话 、 致 电 率 、 电 话费 用 等 特殊 指标 。 

(3) CPS 数 据 

CPS 是 企业 推广 方式 中 转化 效果 最 好 的 推广 方式 之 一 ， 通 常 前 期 已 经 确认 分 成 比例 ， 推 广 渠 道 完成 转化 (通常 定义 为 销售 ) 后 即 分 得 相应 的 佣金 。 
CPS 按 照 平 台 属 性 可 分 为 自 有 平台 和 第 三 方 平台 。 如 京东 既 有 自己 的 京东 销售 联盟 ， 也 有 跟 第 三 方 一 起 合作 的 平台 。 
CPS 类 推广 渠道 非常 特殊 ， 在 业务 的 实际 操作 中 ， 所 有 的 分 成 费用 支出 都 按照 企业 自身 的 销售 系统 数据 结算 。 网 站 分 析 工 具 提 供 的 数据 往往 “不 准 ”， 原 因 有 以 下 几 个 方面 : 

` 跳 转 导 致 的 监测 问题 。 当 用 户 点 击 第 三 方 平台 下 的 联盟 网 站 时 ,会 先 跳 转 到 第 三 方 平台 ， 然 后 再 跳 转 回 推广 落地 页 。 由 于 跳 转 (301 或 302) 的 存在 ， 无 法 保证 数据 被 正常 监测 。 


:订单 监测 时 间 的 问题 。 网 站 分 析 工 具 默 认 的 广告 Cookie 周 期 是 6 个 月 ， 即 如 果 这 段 时 间 内 没有 任何 删除 或 覆盖 规则 ， 那 么 该 Cookie 一 直 有 效 ， 该 用 户 会 一 直 被 标识 为 从 该 CPS 渠 道 进入 ; 但 企业 与 CPS 服 
务 商 的 订单 时 间 周 期 却 可 以 通过 商务 谈判 灵活 确定 为 30 天 或 一 周 等 。 不 同时 间 周 期 内 计算 的 结果 通常 会 有 出 入 。 
. 渠道 恬 盖 规则 问题 。 在 网 站 分 析 工 具 中 通常 都 有 渠道 覆盖 规则 定义 ， 比 如 用 户 在 30 分 钟 内 先后 从 CPS 渠 道 和 SEM 渠 道 进 入 网 站 下 单 ， 通 常 该 订单 会 被 认定 是 SEM 贡 献 的 ; 但 在 销售 跟踪 系统 中 是 通过 


API 回 调 的 形式 跟踪 ， 该 订单 属于 CPS。 这 也 会 造成 数据 不 一 致 。 


.订单 有 效 性 的 问题 。CPS 付 费 通常 都 有 一 定时 间 (通常 是 1~2 个 月 ) 的 延期 ， 除 了 财务 流程 外 ， 还 有 一 个 重要 的 因素 是 CPS 只 按照 有 效 订 单 (用 户 正常 收 货 ) 付费 ， 对 于 下 单 之 后 又 取消 的 订单 记 为 无 
效 订单 而 不 予 支付 。 在 网 站 分 析 工 具 中 ， 线 下 拒 收 、 取 消 等 是 无 法 监测 到 的 数据 。 


既然 如 此 ， 还 有 必要 将 CPS 数 据 导入 网 站 的 分 析 系 统 吗 ? 答案 是 肯定 的 ， 虽 然 数 量 上 会 有 差异 ， 但 网 站 分 析 工具 可 以 基于 双方 交叉 的 样本 提供 基于 网 站 端 用 户 的 行为 分 析 。 
除 通 用 数据 维度 和 指标 外 ，CPS 中 的 特殊 数据 还 包括 联盟 平台 标识 、 佣 金 、 佣 金 率 等 

贸 提 示 “cpSs 的 核心 数据 如 佣金 等 都 位 于 企业 内 部 ， 由 特定 销售 类 系统 负责 监测 、 收 集 和 结算 。 

(4) BD 数 据 

BD (商务 拓展 ) 包括 所 有 以 资源 互 换 、 免 费 合作 等 形式 开展 的 业务 推广 形式 ，BD 通 常 更 多 的 见于 有 一 定 资源 的 企业 。 

BD 由 于 更 多 具有 免费 的 性 质 ， 因 此 各 个 公司 通常 都 有 相应 的 需求 。 关 于 BD 的 具体 数据 与 上 述 介绍 类 似 ， 在 此 不 做 过 多 介绍 

(5) EDM 数 据 

EDM 是 以 电子 邮件 为 介质 进行 推广 的 一 种 方式 ， 精 准 EDM 是 转化 率 最 高 的 渠道 之 一 。 除 上 述 通用 信息 外 ，EDM 数据 还 包括 以 下 特有 数据 。 

. 维度 : 发 送 人 群 (邮件 对 应 的 用 户 ID 或 手机 ) 、 发 送 时 间 、 发 送 域 。 

. 指标 : 发 送 量 (发 送 的 数量 ) 、 送 达 量 (未 被 弹 回 的 数量 ) 、 打 开 量 (打开 邮件 的 数量 ) 、 点 击 量 (点击 邮件 内 容 的 数量 ) 、 退 订 数 ( 仍 订 邮箱 服务 的 数量 ) 。 
(6) 社会 化 媒体 数据 

社会 化 媒体 数据 是 企业 数据 的 重要 延伸 ， 更 是 获得 用 户 社交 信息 的 主要 战场 。 企 业 中 的 社会 化 媒体 通常 包括 微 信 、 微 博 、 论 坛 、BBS 等 ， 

社会 化 媒体 数据 的 维度 包括 : 用 户 账户 信息 、 用 户 属性 信息 、 用 户 行为 信息 、 用 户 标签 信息 、 人 肪 信息 等 。 

用 户 账户 信息 : 用 户 ID、 关 联 账户 信息 (QQ、 微 博 ) 等 。 

. 用 户 属性 信息 : 用 户 名 称 、 年 龄 、 生 日 、 教 育 、 职 业 、 家 庭 、 收 入 、 手 机 号 等 。 


` 用户 行为 信息 : 活动 、 话 题 、 位 置 、 分 享 、 转 发 、 评 论 、 赞 、 签 到 、 转 发 路 径 等 。 


. 用 户 标签 信息 : 个 人 标签 (宅男 、 吃 货 等 ) 、 兴 趣 标签 (科技 、 计 算 机 、 数 据 分 析 等 ) 、 有 勋章 等 。 

" 人 肪 信息: 关注 、 粉 给、 共同 群 组 或 部 落 、 圈 子 等 。 

社会 化 媒体 数据 也 包括 很 多 特色 指标 : 影响 力 、 评 论 量 、 转 发 量 、 回 复 量 、 分 享 量 、 关 注 数量 、 粉 丝 数量 、 影 响 力 、 活 跃 度 、 提 及 率 、 帖 子 导向 度 (正面 、 负 面 、 普 通 ) 等 。 
(7) SEO 数据 

SEO 属 于 营销 推广 中 最 特殊 的 一 类 ， 它 不 属于 付费 推广 ,但 可 能 是 网 站 自然 流量 的 主要 组 成 部 分 。 


搜索 引擎 的 工作 流程 非常 复杂 ， 这 里 只 列 出 其 中 几 个 关键 的 节点 ， 如 图 6-2 所 示 。 


属 蛛 腿 行 信和 朱 展示 用 己 点 击 


图 6-2 ”搜索 引擎 工作 原理 简 图 

1) 师 蛛 聆 行 : 搜索 引擎 通过 特定 程序 (通常 称 为 Spider 或 Robot) 对 不 同 网 站 进行 数据 礁 行 和 抓 取 ， 每 抓 取 一 条 记录 都 会 向 网 站 服务 器 发 送 一 次 请 求 。 
2) 数据 索引 : 搜索 引擎 将 抓 取 到 的 数据 按照 一 定 原则 进行 索引 归 类 ， 并 形成 可 供 查询 使 用 的 数据 仓库 ， 搜 索引 警 服务 商 一 般 不 会 提供 该 数据 。 
3) 算法 排名 : 当 用 户 搜索 某 个 词 时 ， 搜 索引 警 根据 相关 规则 对 该 词 进行 数据 提取 、 结 果 排 序 等 运算 ， 最 终 得 出 不 同 数据 的 记录 排名 ， 这 是 搜索 引 警 的 核心 之 一 ， 所 以 该 数据 无 法 获取 。 
4) 结果 展示 : 搜索 引擎 向 用 户 展示 数据 结果 
5) 用 户 点 击 : 用 户 点 击 感 兴趣 的 结果 并 到 达 相 应 的 网 站 。 
整个 过 程 中 可 获取 如 下 数据 。 

` 易 蛛 疏 行 数据 : 该 数据 在 企业 内 部 IT 服务 器 的 日 志 中 。 

展示 结果 数据 : 关键 字 、 关 键 字 排名 、 页 码 数 等 。 
除了 以 上 基于 用 户 点 击 触发 的 流程 数据 外 ， 还 包括 收录 数 、 页 面 关键 字 密 度 、 关 键 字 排名 、 网 站 PR 值 、Alexa 排 名 、Sogou 指 数 、 百 度 指 数 、 百 度 快 照 、 反 向 链接 数 、404 页 面 数 等 数据 。 
2. 网 站 流量 数据 
网 站 流量 数据 从 网 站 分 析 工 具 中 获取 ， 数 据 平 台 包 括 Web、WAP 和 APP 站 点 。 网 站 流量 数据 包括 来 源 数据 、 访 客 数据 、 网 站 数据 和 转化 数据 四 类 。 

(1) 来 源 数据 


来 源 数据 即 所 有 站 外 流量 来 源 的 信息 ， 包 含 渠道 分 组 、 渠 道 、 媒 介 、 广 告 活动 、 搜 索引 擎 (免费 搜索 引擎 和 付费 搜索 引擎 ) 、 关 键 字 (免费 关键 字 和 付费 关键 字 ) 、 社 交 信 息 (社交 媒体 、 社 交 动 作 ， 
如 分 享 等 ) 、 引 荐 来 源 、 来 源 路 径 及 其 他 自 定义 广告 等 


(2) 访客 数据 


访客 数据 即 所 有 访客 属性 和 特征 信息 ， 包 括 访客 特征 (用户 1D、 年 龄 、 性 别 等 CRM 特 征 ) 、 访 客 兴趣 (购买 类 别 、 浏 览 倾向 等 ) 、 地 理 位 置 (语言 、 国 家 、 城 市 等 ) 、 忠 诚 度 (新 老 访 客 、 访 问 频率 、 


访问 时 间 间 隔 、 购 买 回访 等 ) 、 访 问 设备 (设备 类 型 、 操 作 系统 、 浏 览 器 等 具体 设备 信息 ) 、 移 动 设 备 属性 (设备 类 型 、 具 体 设备 名 、 设 备 运 曹 商 、 地 理 位 置 、 访 问 环境 、 手 机 号 码 、 系 统 版 本 等 ) 、 移 动 
设备 行为 〈 用 户 安装 、 升 级 、 启 动 ， 以 及 用 户 留 存 、 活 跃 度 等 数据 ) 。 


(3) 网 站 数据 
网 站 数据 即 所 有 站 内 页 面 数据 和 非 转化 行为 信息 ， 包 括 访问 页 面 、 进 入 页 面 、 退 出 页 、 站 内 搜索 数据 (搜索 词 、 是 否 有 效 搜索 、 搜 索 返 回 结果 数 ) 、 页 面 事件 、A/B 测 试 等 数据 。 
(4) 转化 数据 


转化 数据 即 所 有 转化 类 信息 ， 包 括 目标 转化 、 电 子 商 务 转化 (产品 浏览 、 加 入 购物 车 、 结 算 、 提 交 订 单 ) 等 。 


注意 在 网 站 数据 整合 过 程 中 ， 需 要 提供 的 数据 粒度 尽量 细 ， 汇 总 类 数据 尽量 少 。 原 因 是 网 站 数据 的 基本 衡量 都 是 以 访问 为 定义 基础 的 ， 大 部 分 维度 之 间 无 法 直接 进行 数据 汇总 。 如 一 个 用 户 访问 了 A 


和 B 页 面 ， 对 全 站 来 讲 是 1 次 访问 ,但 是 对 人 和 B 页 面 来 讲 分 别 是 1 次 访问 ， 全 站 的 访问 不 能 通过 A 和 B 页 面 访问 相 加 得 出 。 
网 站 运营 数据 
网 站 运营 数据 是 指 网 站 运营 管理 者 的 后 台 操 作 数 据 ， 该 数据 是 分 析 站 内 资源 运营 效果 的 重要 过 程 数据 。 如 今 大 多 数 网 站 都 通过 内 容 管理 系统 进行 网 站 管理 ， 针 对 网 站 会 员 或 网 站 内 容 进行 资源 分 配 、 维 
护 和 更 新 等 ， 这 些 数据 直接 反映 了 站 内 各 个 数据 对 象 的 “前 世 今 生 ”。 网 站 运营 数据 主要 包括 商品 管理 数据 、 促 销 管理 数据 、 订 单 管 理 数据 、 广 告 管理 数据 和 会 员 管 理 数据 。 
(1) 商品 管理 数据 


商品 管理 数据 即 所 有 线 上 商品 的 管理 信息 ， 包 含有 时间、 商品 数据 be 商品 属性 、 商 品类 别 、 品 牌 、 商 家 等 ) 、 折 扣 数 据 (价格 、 促 销 价 、 


会 员 优惠 价 、 赠 送 积分 ) 、 促 销 数据 (促销 时 间 、 促 销 
类 型 、 促 销 位置 、 运 费 、 排 序 、 展 示 次 数 ) 、 库 人 存 数 据 、 商 品 状态 (上架 、 删 除 、 过 期 等 ) 、 关 联 促销 管理 ( 绑 定 促销 商品 、 关 联 促销 商品 ) 等 。 


(2) 促销 管理 数据 


促销 管理 数据 即 所 有 站 内 促销 活动 的 管理 信息 ， 包 括 促销 起 止 时 间 、 促 销 活动 类 型 抢购、 团购、 预 售 、 试 有 用、 拍卖、 二 手 等 ) 、 优 惠 券 /积分 管理 (优惠 券 /积分 类 型 、 金 额 、 发 送 条 件 、 有 效 时 间 、 
发 放 数量 、 限 制品 类 、 限 制 金额 、 费 用 、 积 分 部 换 比 例 等 ) 、 活 动 专题 管理 (具体 活动 、 活 动 主题 、 参 与 商品 ) 等 


(3) 订单 管理 数据 


订单 管理 数据 即 所 有 订单 的 管理 信息 ， 包 括 订单 号 、 审 核 状 态 (审核 中 、 未 通过 、 等 待 审核 、 已 提交 等 ) 、 付 款 状 态 (未 付款 、 已 付款 ) 、 支 付 信息 (支付 类 型 、 支 付 银行 、 分 期 付款 信息 等 ) 、 流 转 
环节 (订单 进行 步骤 ， 如 已 出 库 、 已 派 件 ) 、 订 单 合并 (不 同 的 订单 合并 成 一 个 订单 ) 、 订 单 分 拆 (一 个 订单 分 拆 成 几 个 子 订单 ) 、 人 工 订单 (大 客户 订单 处 理 操作 ) 、 订 单 补 货 登 记 等 。 


(4) 广告 管理 数据 
告 管理 数据 即 所 有 站 内 广告 资源 的 信息 ， 包 括 广告 资源 类 型 、 广 告 位 置 、 广 告 排 期 、 广 告 内 容 、 上 下 架 时 间 、 轮 播 次 数 、 广 告 描述 、 广 告 商家 、 广 告 排 等 内 容 。 
(5) 会 员 管 理 数据 


会 员 管 理 数据 即 所 有 线 上 


降价 通知 、 分 享 、 留 言 等 ) 、 


、 是 否 验证 、 邮 箱 、 性 别 、 年 龄 、QQ、 手 机 ) 、 会 员 行为 信息 (注册 时 间 、 登 录 时 间 、 购 买 时 间 、 评 论 、 投 诉 、 咨 询 、 收 藏 、 


管理 的 信息 ， 包 括 会 员 基本 信息 ( 
等 惠 促销 数据 (EDM、 短 信 发 送 数 据 ) 。 


会 员 ID 
等 级 、 积 分 信息 、 优 惠 券 信息 等 、 会 员 
除了 以 上 数据 外 ， 部 分 网 站 可 能 还 有 推荐 功能 ， 推 荐 功能 涉及 的 数据 包括 : 推荐 时 效 性 、 推 荐 数据 源 、 推 荐 规则 、 推 荐 场景 配置 、 阔 值 控制 、 人 工 干预 规则 、 冷 启动 规则 等 。 
4 企业 销售 数据 

销售 数据 是 销售 类 企业 的 核心 ， 交 易 数据 涉及 订单 信息 、 商 品 信息 、 客 户 信息 、 交 易 支撑 环节 等 。 


订单 信息 : 交易 ID、 交 易 日 期 、 订 单价 格 、 订 单数 量 、 优 惠 信 息 (优惠 券 、 积 分 ) 、 折 扣 信 息 〈 满 减 、 满 返 ) 、 订 单 状态 等 。 


` 商品 信息 : 商品 ID、 商 品名 称 、 商 品 品牌 、 商 品类 别 、 商 品 数量 、 商 品 厂商 、 商 品 销售 、 成 本 价 (原始 进货 价 、 预 留 最 低 价 ) 、 销 售 价 格 等 。 


. 客户 信息 : 用 户 ID、 用 户 姓 名 、 注 册 日 期 、 登 录 日 期 、 用 户 QQ、 电 子 邮 箱 、 联 系 方式 等 。 

` 交易 支撑 环节 的 信息 : 如 第 三 方 支付 信息 (支付 平台 、 支 付 银行 、 支 付 状 态 、 支 付 金额 、) 、 联 盟 销 售 信息 (CPS 联盟 、 自 有 平台 、 第 三 方 平台 等 ) 、 配 送 状 态 信 息 等 。 
除 此 之 外 ， 部 分 企业 还 可 能 包括 购物 车 信息 ， 包 括 购物 车 ID、 用 户 ID、 购 物 车 商品 ID、 商 品名 称 、 商 品 数量 、 状 态 步骤 等 。 

5. 线 下 会 员 数 据 


对 于 O20O 类 型 的 企业 或 有 线 下 支持 的 企业 往往 拥有 大 量 的 线 下 用 户 群 体 ， 其 中 很 多 数据 是 线 上 无 法 获得 的 宝贵 财富 ， 如 会 员 性 别 、 年 龄 等 。 线 下 会 员 数 据 比 网 站 运营 数据 的 范畴 更 大 ， 包 含 的 数据 内 容 


更 多 。 


除了 线 上 会 员 的 所 有 数据 外 ， 线 下 会 员 还 会 包括 : 退换 货 数据 (退换 货 金 额 、 订 单 1D、 商 品 ID、 时 间 、 原 因 、 费 用 等 ) 、 订 单 拒 收 数据 ( 拒 收 时 间 、 会 员 ID、 订 单 ID、 订 单价 值 、 运 费 ) 等 ， 甚 至 部 分 
线 下 店面 通过 监控 视频 收集 用 户 线 下 店内 “和 逛 店 ” 行 为 ， 或 者 通过 无 线 Wi-Fi 免 费 开放 等 方式 进行 线 下 用 户 身份 识别 等 ， 都 可 以 提供 更 多 的 会 员 数 据 。 


6. 呼 叫 中 心 数据 


大 型 企业 都 有 呼叫 中 心 业务 ， 通 过 客服 代表 完成 针对 特定 客户 的 特定 业务 目标 ， 如 处 理 投诉 、 推 销 广告 、 销 售 线索 跟 进 、 客 户 维系 等 。 呼 叫 中 心 的 数据 与 其 他 数据 略 有 不 同 : 其 中 包含 大 量 的 非 结 构 化 
数据 一 一 语音 。 


呼叫 中 心 的 数据 除了 包含 结构 化 的 数据 ， 如 话 务 类 型 (投诉 、 咨 询 、 建 议 、 查 询 等 ) 、 工 单 号 、 话 务 时 间 (起 止 时 间 和 持续 时 间 ) 、 话 务 员 、 内 部 接口 人 员 、 排 队 时 间 、 通 话 时 长 、 通 话 放弃 等 外 ， 还 
包括 通话 语音 内 容 。 通 话语 音 内 容 都 是 以 音频 的 形式 存在 的 ， 其 数据 结构 无 法 直接 与 传统 的 结构 化 数据 做 对 接 。 


另外 ， 呼 叫 中 心 的 数据 可 能 包含 所 有 客户 、 网 站 运营 、 销 售 订单 、 物 流 配 送 等 方面 的 数据 。 比 如 用 户 电话 咨询 订单 被 取消 的 原因 ， 呼 叫 中 心 就 需要 调 取 网 站 运营 中 网 站 订单 管理 相关 数据 记录 进行 查询 
和 反馈 ,再 如 用 户 电话 投诉 产品 质量 问题 ， 需 要 呼叫 中 心 通过 该 用 户 信息 关 联 到 该 用 户 的 订单 和 产品 信息 进行 回复 咨询 。 


7. 仓 储 物流 数据 
企业 仓储 和 物流 作业 是 紧密 相连 的 ， 仓 库 内 商品 的 周转 必须 通过 物流 进出 实现 。 因 此 这 里 将 仓储 和 物流 放 到 一 起 介绍 。 


仓储 物流 作业 流程 ， 如 图 6-3 所 示 。 


. 商品 入 库 。 这 是 所 有 仓储 环节 的 第 一 步 ， 企 业 将 商品 从 生产 商 或 上 级 经 销 商 、 代 理 商 品 运 转 到 企业 仓库 ， 形 成 商品 进货 入 库 ; 当 商 品 (尤其 是 爆 款 ) 销售 预期 较 好 时 ， 进行 商品 补 货 处 理 以 满足 订 
单 需要 ， 此 时 会 产生 商品 补 货 入 库 。 


“ 订单 处 理 。 订 单 信息 通过 订单 系统 传输 到 仓储 管理 系统 ， 仓 库 内 完成 订单 处 理 后 通过 物流 配送 到 客户 手中 完成 收 货 ， 此 时 完成 正 向 订单 作业 处 理 ; 当 企 业 回收 或 客户 退货 时 ， 商 品 从 客户 手中 通过 物 
流 返 回 到 仓库 ， 形 成 递 向 订单 作业 处 理 。 


. 库存 调拨 处 理 。 库 存在 不 同 仓库 ( 同 级 仓库 ) 或 不 同 级 别 仓库 ( 子 母 他 、 一 级 二 级 仓 、 物 流 中 心 到 仓库 等 ) 间 进 行 调拨 处 理 ， 以 满足 不 同 仓库 的 商品 需求 。 


站 传 入 座 外 货 入 库 
进 代 入 库 下 向 订单 作业 处 理 


由 席 调 按 通 向 订单 作业 处 理 


物流 


入 库 调 找 


仓储 系统 


图 6-3 ”仓储 物流 作业 流程 
(1) 仓储 数据 
企业 仓储 数据 主要 包括 基本 数据 、 入 库 数 据 、 出 库 数 据 和 调拨 数据 。 


基本 数据 通常 是 仓库 内 的 静态 数据 ， 包 括 商品 信息 《商品 编码 、 条 形 码 、 商 品名 称 、 规 格 参数 、 计 量 单位 、 有 效 期 、 进 货 价 、 进 货 批 次 、 商 品类 别 、 商 品 品牌 、 商 品 供应 商 和 生产 商 等 ) 、 仓 库 信 息 
(仓库 编码 、 仓 库 名 称 、 仓 库 地 址 、 库 管 员 、 联 系 信息 等 ) 、 供 应 商 信息 (供应 商 编 码 、 供 应 商 名 称 、 供 应 商 地 址 、 联 系 信息 、 银 行 信息 等 ) 、 商 品 库存 信息 (商品 编码 、 库 存 类 型 、 库 存量 、 库 存 人 金额 、 
库存 时 间 、 有 效 期 ) 等 。 


. 入 库 数据 涵盖 了 采购 入 库 、 退 货 入 库 数据 ， 包 括 时 间 、 入 库 类 型 (采购 、 补 货 、 退 货 等 ) 、 批 次 信息 、 商 品 信息 (进货 价 、 数 量 、 人 金额 、 破 损 情 况 ) 、 采 购 商 信息 (供应 商 编 号 、 交 货 日 期 、 制 单 日 
经 手 人 、 操 作 员 ) 、 关 联 订 单 信息 、 关 联 配送 单 信息 等 


" 出 库 数据 涵盖 了 订单 出 库 数 据 ， 包 括 时 间 、 仓 库 信息 (仓库 编码 ) 、 出 库 信 息 〈 出 库 类 型 如 订单 、 报 废 、 退 回 厂家 等 ， 以 及 出 库 编码 ) 、 商 品 信息 〈 出 货 价 、 数 量 、 金 额 ) 、 窜 户 信息 〈 姓 名 、 地 
址 、 联 系 方式 等 ) 、 关 联 订 单 信息 、 关 联 配 送 单 信息 等 。 


* 调拨 数据 是 一 类 特殊 数据 ， 商 品 调拨 在 会 计 中 会 计算 为 商品 销 信 处理 ,但 在 公司 内 部 各 部 门 间 计算 成 本 和 收入 时 需要 将 其 别 除 。 调 拨 数 据 包括 单据 编码 、 日 期 、 调 出 仓库 、 调 入 仓库 、 制 单 人 员 、 复 
查 人 员 、 审 查 人 员 、 关 联 配 送信 息 、 调 拨 商 品 信 息 (商品 编码 、 名 称 、 批 次 、 单 价 、 数 量 、 总 金额 ) 等 。 


除 以 上 信息 外 ， 如 果 企业 选择 第 三 方 仓 储 则 会 有 第 三 方 仓储 的 信息 。 
(2) 物流 数据 

物流 数据 主要 包括 客户 数据 、 订 单数 据 、 车 辆 数据 和 路 线 数据 四 部 分 。 
客户 数据 包括 客户 姓名 、 联 系 方 式 、 发 货 地 址 等 信息 

.订单 数据 包括 订单 编码 、 送 货 时 间 、 货 物 重量 、 收 货 人 姓名 、 收 货 人 联系 方式 收 货 人 地 址 、 配 送 方式 、 配 送 状态 、 配 送 费用 等 。 


“ 车 辆 数据 包括 交通 方式 、 车 队 编码 、 配 送 车 辆 编码 、 配 送 人 人员、 生产 日 期 、 购 买 日 期 等 。 


: 路 线 数据 包括 配送 路 线 (起 始 城市 、 中 转 城市 、 终 点 城市 ) 、 路 线 长 度 、 地 理 位 置 、 预 计时 间 、 配 送 区 域 、 配 送 站 点 、 交 接 数据 (交接 编码 、 交 接 人 、 上 一 级 区 域 、 本 级 区 域 、 交 接 状 态 、 时 间 ) 


6.2.2 ”有数 据 整合 
IT 数据 整合 的 意义 是 利用 IT 数据 拓展 网 站 分 析 工 具 (尤其 是 SAAS 模 式 网 站 的 分 析 工 具 ) 所 缺乏 的 数据 维度 和 指标 。1T 主 要 整合 的 数据 是 网 站 日 志 以 及 基于 现 有 的 网 站 架构 数据 。 


1. 日 志 数 据 


网 站 分 析 工 具 可 以 提供 用 户 的 访问 日 志 数 据 ， 但 主流 的 工具 都 采用 SAAS 模 式 ， 通过 页 面 标签 来 记录 用 户 信息 的 。 很 多 信息 无 法 通过 页 面 标签 法 (SAAS 模 式 下 的 信息 采集 方法 ) 记录 ， 即 使 可 以 实 
现 也 相对 复杂 ， 如 HTTP 状 态 码 数据 和 User-Agent 数 气 。 


(1) HTTP 状 态 码 数据 


HTTP 状 态 码 (HTTP status Code) 是 用 以 表示 网 页 服务 器 HTTP 响 应 状态 的 3 位 数字 代码 ， 所 有 状态 码 的 第 一 个 数字 代表 了 响应 的 状态 。 


. 1 开头 的 状态 码 。 这 是 一 类 信息 状态 码 ， 表 示 请 求 已 被 接受 ， 需 要 继续 处 理 。 这 类 响应 是 临时 响应 ， 只 包含 状态 行 和 菜 些 可 选 的 响应 头 信息 并 以 室 行 结束 ， 常 见 的 如 100、102 等 。 


. 2 开头 的 状态 码 。 这 是 一 类 成 功 状 态 码 ， 表 示 请 求 已 成 功 被 服务 器 接收 、 理 解 并 接受 ， 最 常见 的 是 200、206。 


3 开头 的 状态 码 。 这 是 一 类 重 定向 状态 码 ， 表 示 需 要 客户 端 采 取 进 一 步 的 操作 才能 完成 请 求 。 通 常 这 类 状态 码 用 来 重 定向 后 续 的 请 求 地 址 ( 重 定向 目标 ) ， 其 在 本 次 响应 的 Location 域 中 指明 ， 常 见 的 


是 301、302。 


“ 4 开头 的 状态 码 。 这 是 一 类 请 求 错 误 状 态 码 ， 表 示 客 户 端 看 起 来 可 能 发 生 了 错误 ， 妨碍 了 服务 器 的 处 理 ， 常 见 的 如 404。 


“ 5 开头 的 状态 码 。 这 是 一 类 服务 器 错误 状态 码 ， 表 示 错 误 发 生 在 服务 器 端 ， 常 见 的 如 503、504 等 。 


这 些 状态 码 数据 对 网 站 分 析 有 什么 作用 呢 ? 


通过 网 站 分 析 工 具 分 析 用 户 行为 时 ， 通 常 只 能 得 到 结果 数据 ， 如 跳出 率 、 退 出 率 、 停 留 时 间 等 ， 但 状态 码 可 以 提供 “发 生 了 什么 ”的 过 程 数据 ， 例 如 : 


" 发 生 404 错 误 的 页 面 通常 页 面 退出 率 和 跳出 率 高 且 停 留 时 间 短 。 


口 AP 


. 针对 用 户 点 击 下 载 的 监测 ， 如 果 采 用 页 面 标记 法 只 能 检测 是 否 有 点 击 下 载 的 行为 ， 即 回答 是 否 下 载 ， 但 无 法 监测 下 载 完 成 情况 ， 在 日 志文 件 中 通过 206 状 态 码 可 以 检测 整个 下 载 过 程 。 


* 在 某 些 情况 下 《比如 大 型 促销 活动 时 ) 会 发 现 一 些 特殊 情 况 ， 如 某 页 面 没有 数据 或 两 个 特定 的 页 面具 有 完整 的 路 径流 ， 其 中 可 能 存在 跳 转 的 问题 。 无 论 是 301 还 是 302 跳 转 ， 大 部 分 情况 下 都 会 导致 跟 


踪 代码 丢失 而 无 法 正确 跟踪 到 数据 ; 即使 在 一 小 部 分 情况 下 能 正常 跟踪 到 数据 ， 也 会 发 现 被 跳 转 的 页 面 跳出 率 和 退出 率 高 、 页 面 停留 时 间 短 ， 并 且 跳 转 前 后 的 页 面 直接 形成 没有 其 他 路 径 参 与 的 路 径流 向 。 


这 些 数据 可 以 通过 HTTP 状 态 码 分 析 直 接 获取 。 

(2) User-Agent 数 据 

大 多 数 蝴 蛛 不 会 聆 行 JS 文件 ， 这 种 工作 机 制 的 好 处 在 于 页 面 标签 法 可 以 自动 过 滤 掉 晴 蛛 爬行 数据 而 只 保留 真正 的 “用 户 ” 数 据 ; 但 另 一 方面 ， 排 除 蜘蛛 肛 行 数据 的 同时 也 意味 着 无 法 通过 分 析 搜 索引 擎 
晤 蛛 在 网 站 上 的 肛 行 行为 而 为 SEO 服 务 。 

什么 是 蜘蛛 ? 所 亩 “ 蜂 蛛 ”， 实 际 上 是 一 种 计算 机 “机 器 人 ”， 它 是 以 检索 信息 为 目的 的 软件 程序 。 它 可 通过 网 页 的 链接 地 址 来 寻找 其 他 网 页 ， 从 网 站 某 一 个 页 面 (通常 是 首页 ) 开始 读 取 网 页 的 内 
容 ， 找 到 在 网 页 中 的 其 他 链接 地 址 ， 然 后 通过 这 些 链接 地 址 寻找 下 一 个 网 页 ， 这 样 一 直 循 环 下 去 ， 直 到 把 这 个 网 站 所 有 的 网 页 都 抓 取 完 为 止 ， 这 样 不 断 工作 形成 类 似 蜂 蛛网 一 样 的 工作 环境 。 

蜂 蛛 爬行 的 目的 是 采集 网 页 信息 ， 日 志 中 的 蜘蛛 主要 是 搜索 引擎 师 蛛 ， 即 用 来 为 搜索 引 警 服务 ; 其 次 还 会 有 企业 或 个 人 制作 的 用 于 特定 目的 的 蜘蛛 程序 。 在 正常 情况 下 ， 所 有 网 页 上 的 访问 记录 都 有 
User-Agent 信 息 ， 并 通过 User-Agent 识 别 不 同 的 晴 蛛 程序 。 以 下 是 一 段 百 度 蜘蛛 的 爬行 记录 : 


thttp: // www.baidu.com, 


v\-” WMozilla/5.0 (compatible; Baiduspider/2.0; 


180.76.5.71 - - [30/Apr/2014: 20: 33: 03 +0800] “GET /website-optimization-resources HTTP/1.1” 200 8814 


从 以 上 记录 中 我 们 看 到 该 百度 蜂 蛛 名 为 Baiduspider， 对 应 的 IP 为 180.76.5.71， 它 是 在 北京 时 间 2014 年 4 月 30 日 20: 33: 03 肛 行 了 一 个 website-optimization-resources 网 页 ， 网 页 胞 行 返回 200 成 功 


状态 码 。 通 过 这 段 日 志 信 息 ， 可 以 很 容易 地 分 析出 搜索 引擎 到 企业 网 站 的 候 行 习惯 ,如 时 间 、 路 线 ， 蜂 蛛 类 型 (不 同 的 蜘蛛 有 不 同 的 礁 行 目的 ) 、 网 页 返回 信息 (大 量 404 页 面 会 被 搜索 引擎 认为 网 站 价值 


民 低 ， 正 常 应 该 返回 200) 等 ， 针 对 这 些 信息 ， 可 以 为 站 内 内 链 分 布 、 页 面 错 误 检索 、 页 面 发 布 更 新 、 服 务 器 压力 调整 和 优化 等 提供 数据 支持 。 


~、 


2. 网 站 架构 数据 
网 站 分 析 工 具 能 跟踪 所 有 的 进行 标记 的 页 面 信息 ， 但 这 些 页 面 信息 都 是 孤立 的 信息 点 ， 其 中 很 多 可 以 通过 IT 拓 展 出 更 多 的 分 析 维 度 。 
(1) URL 结 构 数 据 

URL 结 构 中 包含 了 当前 页 面 的 重要 信息 ， 以 下 是 某 网 站 平板 电脑 页 面 的 URL: 


FPl18wv18wF-0-0-0-0-0-0-0-0.html 


http: // www.***.cn/category/cat10000049-10-0-36-1-0-0-0-1-14VF181 
该 URL 中 包含 了 产品 列表 名 、 品 牌 、 价 格 、 屏 幕 尺寸 、 产 品类 型 、 排 序 方式 、 商 品 库存 类 型 、 送 货 地 域 、 分 辨 率 、 功 能 、 属 性 等 信 ， 
普 品牌 ;18wF 代 表 1000 以 下 的 价格 区 间 等 。 


这 些 参数 可 以 通过 页 面 自 定义 变量 提取 出 来 整合 到 系统 中 ， 从 而 得 到 更 多 深层 次 的 数据 价值 点 : 品牌 喜好 度 、 价 格 人 敏感 特征 、 屏 幕 尺寸 偏好 等 ; 如 果 用 户 有 登录 行为 ， 可 以 直接 通过 用 户 1D 关 联 到 用 户 


意义 。 


(2) 网 站 结构 数据 

IT 部 门 在 设计 网 站 时 ， 已 经 根据 特定 的 规则 和 目标 将 网 站 结构 和 产品 功能 进行 划分 ， 这 些 不 同 的 结构 和 功能 数据 都 可 以 整合 到 数据 系统 ， 如 页 面 结构 数据 、 产 品 功能 数据 。 

:页面 结构 数据 。IT 部 门 可 以 将 网 站 结构 数据 整合 到 数据 系统 中 ， 包 括 页 面 分 类 层级 、 分 类 具体 信息 、 子 页 面 等 ， 这 些 信 息 可 以 直接 将 网 站 页 面 层 级 化 、 结 构 化 。 

产品 功能 数据 。 除 了 页 面 级 别 的 数据 整合 外 ， 页 面 中 具体 产品 的 功能 同样 可 以 整合 ， 如 浮 层 、 按 钮 、 标 签 、 表 单 、 图 片 、 文 字 等 。 通 过 整合 这 些 数据 ， 可 以 对 网 站 功能 或 页 面 对 象 做 出 划分 ， 方 便 晶 
后 网 站 功能 优化 、 用 户 体验 优化 等 。 


除了 业务 数据 、IT 数 据 以 外 ， 企 业 还 有 一 类 特殊 数据 一 一 职能 数据 。 职 能 数据 是 独立 于 业务 数据 之 外 的 独立 体系 ， 反 映 了 整个 公司 除 业务 外 的 运营 状态 和 信息 ， 包 括 财务 数据 、HR 数 据 、 办 公 数 据 等 。 


职能 数据 的 整合 是 企业 内 部 流程 化 、 标 准 化 运作 的 基础 ， 也 是 优化 内 部 效率 和 投入 产 出 比 的 重要 途径 ， 更 是 观测 企业 风险 和 发 展 趋势 的 风向 标 。 由 于 本 书 的 主要 对 象 是 业务 人 员 ， 因 此 智能 数据 在 此 不 展开 


人 对 


DY 


除了 企业 内 部 数据 外 ， 企 业 外 部 数据 如 市 场 数据 、 行 业 数据 、 竞 争 对 手数 据 等 也 是 企业 数据 整合 的 重要 信息 ， 这 些 信 息 包 含 了 企业 在 市 场 中 的 地 位 、 作 用 和 竞争 信息 ， 能 够 帮助 企业 建立 整个 行业 级 的 


人 
数据 视角 ; 同时 ， 关 键 市 场 和 情报 信息 还 会 提供 关键 市 场 机 会 ， 如 竞争 对 手 的 产品 动态 、 价 格 策略 、 广 告 策略 等 。 这 些 信息 是 企业 数据 整合 的 重要 部 分 。 


6.3 ”网 站 数据 整合 的 方法 


网 站 数据 整合 可 分 为 在 线 数据 整合 和 本 地 数据 整合 ， 在 线 数据 整合 常用 于 部 门 或 业务 数据 应 用 ; 本 地 数据 整合 是 企业 级 数据 应 用 。 
6.3.1 在线 数据 整合 


在 线 数据 整合 是 指 借助 现 有 的 在 线 数 据 工具 ， 整 合 其 他 所 有 的 数据 源 。 网 站 分 析 工 具 由 于 已 经 具备 网 站 流量 的 相关 数据 ， 只 需 将 外 部 数据 整合 到 网 站 分 析 工 具 中 然后 进行 分 析 即 可 ， 因 此 更 多 被 应 用 于 
在 线 数 据 整合 的 平台 。 


1. 在 线 数据 整合 的 最 佳 适用 场景 
虽然 网 站 分 析 工 具 支 持 导 入 外 部 数据 源 ， 如 销售 、 库 存 、 物 流 等 数据 ， 但 其 本 质 还 是 访客 (用 户 ) 行为 分 析 工 具 。 
. 数据 采集 逻辑 : 网 站 分 析 工 具 的 基础 数据 是 通过 在 线 用 户 行 为 产生 的 ， 因 为 所 有 的 数据 都 是 用 户 的 数据 结果 。 


“ 数据 处 理 逻 辑 : 网 站 分 析 工 具 的 数据 处 理 都 是 基于 访问 产生 的 ， 无 论 是 维度 〈 如 页 面 、 渠 道 、 订 单 、 站 内 行为 ) 还 是 指标 (如 跳出 、 停 留 时 间 、 转 化 率 等 ) ， 都 是 定义 在 一 个 访问 区 间 内 的 动作 。 


. 数据 应 用 导向 : 网 站 分 析 工 具 提供 的 数据 支持 对 象 以 线 上 业务 对 象 为 主 ， 如 网 站 营销 、 网 站 运营 、 用 户 体验 等 ， 而 对 于 线 下 广告 投放 、 线 下 门店 销售 、 线 下 物流 配送 的 指导 意义 较 小 。 
在 线 数据 整合 的 最 佳 适用 场景 包括 两 种 : 一 种 是 以 网 站 为 载体 的 部 门 应 用 ; 另 一 种 是 以 用 户 为 对 象 的 数据 应 用 。 
(1) 以 网 站 为 载体 的 部 门 应 用 


以 网 站 为 载体 的 部 门 应 用 是 指 业 务 部 门 的 业务 动作 围绕 网 站 开展 ， 这 些 部 门 包括 网 站 营销 、 网 站 运营 、 用 户 体验 、 产 品 功能 设计 、 在 线 销售 等 。 通 过 网 站 数据 整合 ， 实 现 对 这 些 业 务 部 门 的 数据 支持 ， 
这 是 典型 的 业务 应 用 场景 ， 也 是 各 个 公司 最 初级 的 数据 整合 需求 。 


在 这 种 数据 整合 需求 下 ， 各 个 部 门 具有 明确 的 业务 整合 目标 与 实现 需求 ， 在 业务 需求 针对 性 、 理 解 有 效 性 和 应 用 落地 性 上 具有 优势 ， 整 合 之 后 的 在 线 数据 可 被 各 部 门 直 接 使 用 。 
(2) 以 用 户 为 对 象 的 数据 应 用 


以 用 户 为 对 象 的 数据 应 用 的 侧重 点 是 围绕 用 户 的 所 有 数据 整合 ， 相 比较 以 网 站 为 载体 的 部 门 应 用 ， 这 种 整合 方式 更 加 具有 全 局 性 。 整 合 后 的 数据 全 部 围绕 用 户 展开 ， 包 括 用 户 获取 (站 外 营销 推广 ) 、 
用 户 访问 〈 网 站 运营 、 产 品 功能 、 用 户 体验 ) 、 用 户 维系 (会 员 维 护 、 运 营 支 持 、 售 后 咨询 ) 的 整个 环节 ， 形 成 用 户 从 进入 网 站 、 潜 在 客户 、 客 户 、 流 失 的 完整 生命 周期 。 


这 个 层级 的 需求 比 各 个 业务 部 门 的 需求 更 进一步 ， 因 为 它 通过 一 条 主线 (用户) 关联 了 所 有 与 之 相关 的 业务 环节 ， 并 使 各 个 环节 之 间 在 做 数据 分 析 时 不 仅 停 留 在 分 散 的 业务 节点 上 ， 还 更 进一步 将 点 连 
成 线 ， 提 供 了 业务 流 的 线条 视角 。 


2. 在 线 数据 整合 的 最 佳 数据 源 
所 有 数据 整合 必须 具有 一 定 的 数据 关联 性 ， 否 则 数据 之 间 还 是 以 独立 个 体 存 在 而 无 法 形成 整体 。 在 线 数据 整合 的 最 佳 数据 源 包括 营销 数据 、 会 员 数 据 、 运 营 数 据 和 外 部 环境 数据 四 类 。 
(1) 营销 数据 


网 站 分 析 工 具 通 过 插 码 标记 来 识别 不 同 的 推广 渠道 ,不同 的 渠道 通过 代码 区 分 。 渠 道 代码 就 是 营销 数据 关联 的 主键 ， 通 过 整合 的 营销 数据 包括 推广 渠道 分 组 、 营 销 费 用 、 营 销 媒 介 信 息 等 。 图 6-4 所 示 为 
根据 站 外 推广 Tracking Code 将 渠道 划分 为 模块 (Module) 、 一 级 渠道 (LV1 Channel) 、 二 级 渠道 (LV2 Channel) 三 个 层级 。 


(2) 会 员 数 据 


大 多 数 网 站 都 有 登录 注册 系统 ， 当 用 户 发 生 登 录 或 注册 行为 后 ， 可 以 记录 该 用 户 的 唯一 识别 标识 (如 用 户 1D) ， 通 过 该 标识 可 以 把 会 员 或 CRM 数 据 传 到 在 线 网 站 分 析 系 统 进行 整合 。 图 6-5 所 示 为 通过 
整合 CRM 数 据 ， 将 用 户 年 龄 导入 网 站 分 析 系 统 中 ， 该 数据 可 以 报表 、 下 钼 、 细 分 、 交 叉 等 方式 进行 客户 属性 和 喜好 分 析 。 
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图 6-4 将 渠道 分 组 数据 整合 到 Adobe Analytics 
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图 6-5 Webtrekk URM 用 户 年 龄 报表 
(3) 运营 数据 


网 站 运营 数据 整合 涉及 非常 多 的 数据 信息 ， 包 括 以 产品 1D 为 主键 的 产品 属性 (品类 、 品 牌 、 参 数 、 尺 寸 、 颜 色 等 ) 、 以 订单 1D 为 主键 的 订单 信息 (订单 状态 、 订 单 来 源 、 配 送 地 域 、 配 送 用 户 信息 、 使 
用 优惠 券 等 ) 、 以 促销 ID 为 主键 的 促销 信息 整合 (促销 活动 ID、 时 间 、 应 用 品类 、 限 制 金额 、 发 放 优惠 券 类 型 、 促 销 费用 等 ) 、 以 站 内 资源 位 ID 为 主键 的 站 内 广告 信息 整合 (资源 位 ID、 页 面 、 位 置 、 排 
期 、 对 应 内 容 、 轮 播 次 数 ) 等 ， 这 些 信息 是 网 站 端 分 析 的 重要 拓展 属性 ， 从 某 种 程度 上 来 说 ， 网 站 上 所 有 的 业务 元 素 ， 只 要 存在 对 应 关系 ， 都 可 以 进行 数据 整合 。 图 6-6 所 示 为 将 订单 状态 、 来 源 、 送 货 省 
市 、 手 机 号 等 信息 整合 到 网 站 分 析 工 具 中 。 


(4) 外 部 环境 数据 


外 部 环境 数据 是 指 通过 一 定 关 联 特征 (如 时 间 ) 将 外 部 客观 环境 的 数据 整合 到 网 站 分 析 工 具 中 。 这 些 外 部 数据 是 业务 认定 的 对 网 站 关键 目标 影响 较 大 的 因素 ， 如 外 部 搜索 引擎 收录 数据 、 天 气 数据 等 。 
图 6-7 所 示 为 某 网 站 将 外 部 天 气 数据 导入 系统 中 用 来 分 析 温 度 变化 与 网 站 流量 、 转 化 的 影响 ， 甚 至 可 以 分 析 与 某 些 渠道 之 间 是 否 具有 特定 的 关联 特征 。 
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图 6-6 ”将 订单 信息 整合 到 Adobe Analytics 


Page I Bounce Rate % Conversion Rate Organic Se 


12.44 21,87 % 学 529 15.53 折 


12 .22 23.43% 大 4.73 15,26 % 
12,85 2208% 大 5.01 15 ,48 的 
12,30 24.85 % 才 13.74 鹃 
13,36 23,44% 大 14.59 % 
入 祝 22 .16 骆 15 ,23 咀 
11,53 23.58 % 三 1 14 57 拍 


12,04 22.41% 14,98 % 


图 6-7 将 天 气 数据 导入 Webtrekk 
3. 在 线 数 据 整 合 的 常用 方法 
在 线 数据 整合 方式 分 为 Excel 上 传 、 账 户 整合 设置 、APl 单 独 开发 三 种 。 
(1) Excel 上 传 


几乎 所 有 的 付费 网 站 分 析 工 具 都 支持 这 种 功能 ， 通 过 Excel 按 照 一 定 的 格式 进行 数据 整理 后 ， 采 取 手 动 或 自动 的 形式 传输 到 固定 服务 器 或 后 台 界 面 。 下 面 以 Adobe Analytics 的 SAINT 功 能 上 传 产品 类 别 
信息 为 例 ， 简 单 介绍 Excel 上 传 数据 的 基本 步骤 。 


步骤 一 : 建立 分 类 字段 。 登 录 Adobe Analytics 后 台 管 理 员 管 理 界 面 ， 进 入 “转化 分 类 ”。 在 “选择 分 类 类 型 ”中 选择 “产品 ” (要 扩展 的 字段 ) ， 依 次 建立 产品 名 称 、 品 牌 以 及 一 、 二 、 三 级 分 类 ， 如 
图 6-8 所 示 。 


步骤 二 : 下 载 数据 模板 。 打 开 “ 管 理 员 -SAINT” 菜 单 ， 会 出 现 SAINT 操 作 面板 ， 如 图 6-9 所 示 。 选 择 要 导入 数据 的 报表 包 和 要 分 类 的 数据 集 (步骤 一 中 设置 的 转化 变量 ) ， 然 后 单 击 “ 下 载 ” 按 钮 。 


转化 分 类 
分 淆 可 缩 值 分 姐 归 类 并 在 组 级 齐 上 殷 削 。 例 如 
一 旦 尼 用 分 类 ， 您 吉 可 使 用 SAINT 给 特定 值 ! 


贫 人 本 郊 闯 。 渍 且 用 日 期 的 女 本 分 基 


an 因 

“全 产 品名 称 国 
产品 品牌 国 
nm 


SAINT 分 类 


下 载 蜀 概 导入 站 件 。” 麟 殉 妮 守 出 ”FTP 守 出 


当 您 下 载 SAINT 立 件 时 ， 况 件 格式 必须 仿照 SAINT 标准 

此 时 ， 您 可 以 下 载 一 个 模板 作 洲 数据 导 和 向导。 单 击 下 面 的 "下 载 模板 "按钮 ， 立 刻下 载 以 制 表 符 分 有 
选择 报表 包 .: 

要 分 类 的 数据 集 : 


导出 数值 2 0293; 
编码 


图 6-9 下载 SAINT 中 的 数据 模板 


步骤 三 : 打开 数据 模板 并 按照 格式 整理 好 原始 数据 ， 如 图 6-10 所 示 。 数 据 模板 提供 了 在 步骤 一 中 设置 的 字段 ， 只 需要 在 Key、 产 品名 称 、 产 品 品牌 、 一 级 分 类 、 二 级 分 类 、 三 级 分 类 列 中 填 入 相应 的 字 


| 


"## SC indicates a SiteCatalyst pre-process header. Please do not remove these lines. 
D:2013-02&:166022:91 
产品 名 称 产品 遇 牌 “一 级 分 其 二 级 分 类 三 级 分 类 


图 6-10 SAINT 数据 模板 
全 证 示 数据 模板 中 的 Key 就 是 在 步骤 一 中 设置 的 变量 “产品 ”， 也 是 数据 关联 的 主键 ， 大 多 数 情况 下 区 ey 由 数字 或 字母 组 成 ， 应 尽量 避免 使 用 汉字 ， 以 避免 由 于 编码 问题 造成 无 法 识别 的 问题 。 


步骤 四 : 上 传 数据 。 上 传 Exce| 数 据 通常 有 两 种 方式 可 供 选择 ， 即 直接 通过 浏览 器 界面 导入 或 通过 FTP 导 入 。 通 过 浏览 器 导入 非常 简单 ， 打 开 图 6-9 中 第 二 个 标签 “导入 文件 ”上 传 即 可 。Adobe 
Analytics 提 供 了 通过 FTP 上 传 数据 的 方式 。 


首先 建立 FTP 账 户 。 单 击 “FTP 导 入 -新 增 ”， 在 弹出 的 对 话 框 中 进行 如 图 6-11 所 示 的 设置 。 建 好 FTP 地 址 后 ， 会 显示 FTP 地 址 信息 ， 包 括 主机 、 登 录 名 和 密码 。 


目标 


要 分 美的 数据 集 : | 产品 
选择 报表 包 : 


可 用 报表 包 


时 入选 承 
以 入 盖 中 突 的 数据 


门 导 六 完成 后 ,在 相同 的 FTP 位 置 导出 SAINT 交 件 
[ 玄 件 将 以 "6C_EXPORT "和 报表 和 包 开 头 ) 


通知 收 件 人 
将 性 何 通知 发 送 到 以 下 收 件 人 
TT 
[v 我 授权 SiteCatalyst 自动 导入 发 送 到 此 FTP 帐户 的 所 有 文件 


图 6-11 设置 FIP 信 息 
其 次 ,创建 和 SAINT 数 据 文件 同名 的 扩展 名 为 .fin 的 空 文件 。 


最 后 ， 使 用 FTP 工 具 或 通过 程序 自动 上 传 文件 。 将 创建 的 SAINT 数 据 文件 (扩展 名 为 .tab 的 数据 文件 ) 和 扩展 名 为 .fin 的 空 文件 上 传 到 FTP 的 根 目录 下 ， 如 图 6-12 所 示 为 数据 文件 和 触发 文件 。 


名 称 修改 日 其 EE 


LL SiteCatalyst Classifications fin 2012/916 11209 FIN 文件 
EB] SiteCatalyst Clessifications+ab 20121916 1243 TAB 文件 


图 6-12 ”数据 文件 和 触发 文件 
@ia 示 处 理 SAINT 文 件 所 需 的 时 间 因 文件 大 小 、 数 量 而 异 ， 通 常 Adobe 处 理 SAINT 文 件 不 超过 72 小 时 。 


到 此 为 止 ， 通 过 Excel 上 传 数据 的 功能 即 可 实现 。 当 处 理 完成 后 ， 图 6-11 中 指定 的 收 件 人 邮箱 会 收 到 Adobe 发 送 的 SAINT 数 据 处 理 信息 ， 如 图 6-13 所 示 。 处 理 成 功 后 的 数据 可 在 相应 的 报表 字段 中 看 


Adobe Marketing Cloud 
SAINTimport 
SuUrmrmary 


File [mport 


Statue: assifications have been Iimported and will appear in all related reports when 


synchronization is complete. 


woe 


Data Set: Campaligns 


Detalls 


Files and upload times: 


1) siteCatalyst Classificationsi.tab: uploaded al 2012-10-29 2334:30 
2) steCatalyst Classifications.tab: uploaded al 2012-10-29 2334.29 


(2) 账户 整合 设置 


账户 整合 设置 在 之 前 的 章节 讲 过 很 多 ， 比 如 Webtrekk 的 端口 、Google Analytics 的 Adwords 和 Adsense 等 整合 ， 


(3) APl 单 独 开 皮 


图 6-13 SAINT 处 理 反 馈 信 息 


是 直接 通过 后 台 设 置 相应 的 对 接 账户 信息 即 可 完成 信息 的 整合 工作 。 


很 多 工具 都 支持 通过 API 的 形式 将 数据 导入 网 站 分 析 系 统 ， 如 Webtrekk 支 持 SOAP 和 JSON。 以 下 是 使 用 Perl 通 过 SOAP 界 面 导 入 数据 的 示例 : 


#! /usr/bin/perl 

use SOAP: : Lite:; 

use MIME: : Base64; 

use strict; 

# Connection parameter 

my S$endpoint = “http: // report2.webtrekk.de/cgi-bin/wt/SOAPv3.cgi”; 
my $soapaction = “urn: reportSOAP#importData”; 

my $method = ‘importData’; 
my $method urn = ‘urn: objects: : reportSOAP’; 
# Configuration of requested report 

my Sparameter = ( 


customerId => “111111111111111"”,， 
Jogin => ‘mylogin’, 

pass => ‘mypass’, 

uploadType => ‘content categories’, 


uploadData => [ 
[\‘Pages’, ‘Category (Text) - Main Category’, ‘Category 
[‘index’, ‘archive’, ‘1’], 
[‘home’, ‘archive’, ‘2’] 
] 2 
# Prepare request 
my $soap = SOAP: : Lite->new 人 
Uri => $soapaction, 
proxy => $endpoint, 
on fault => sub { 
my ($soap, S$res) = @; 
print “\nFault: \n------”; 
print “\nfaultcode: ‘“.S$res->faultcode:; 
print “\nfaultstring: “.S$res->faultstring.”\n"; 
return:; 


} 
) ; 
# Start SOAP-request 
my $response = $soap->call (SOAP: : Data->name ($method) ->attr ( 
{ xmlns => $method urn } 
) => (\%parameter) ) 
# Retrieve results 
my $data = $response->result:; 


6.3.2 ”本 地 数据 整合 


据 ， 


(Number) — ownC.’], 


本 地 数据 整合 是 指 将 所 有 的 数据 整合 到 企业 内 部 ， 形 成 供 企业 所 有 部 门 应 用 的 企业 数据 仓库 。 


1. 本 地 数据 整合 的 最 佳 适 用 场景 


本 地 数据 整合 与 在 线 数据 整合 相 比 ， 它 是 在 原始 业务 节点 、 初 始 汇 总 业务 流 线 条 的 基础 上 形成 的 全 面 的 业务 数据 流 ， 


这 是 企业 数据 整合 的 最 终 阶段 。 


企业 级 数据 集成 大 多 基于 本 地 实现 ， 一 方面 很 多 企业 数据 更 有 价值 、 更 巨 量 的 数据 产生 于 线 下 ， 例 如 交易 、 付 款 等 ， 另 一 方面 出 于 安全 性 的 考虑 ， 数 据 在 企业 内 部 通常 更 安全 。 


2. 本 地 数据 整合 的 最 佳 数据 源 


本 地 数据 整合 包含 了 企业 所 有 的 数据 集 ， 包 括 网 站 流量 数据 、 网 站 运营 数据 、 企 业 销 售 数 据 、 线 下 会 员 数 据 、 呼 叫 中 心 数 据 、 仓 储 物流 数据 、[T 日 志 、 网 站 架构 数据 以 及 企业 财务 数据 等 企业 的 内 部 数 


网 站 营销 数据 、 市 场 数 据 、 行 业 数据 、 竞 争 对 手数 据 等 外 部 环境 数据 。 


本 地 数据 整合 后 的 数据 通常 称 为 EDW， 即 企业 数据 仓库 。 在 企业 数据 仓库 的 基础 上 ， 形 成 针对 企业 的 不 同 层级 决策 、 不 同业 务 优化 、 不 同 需求 触发 、 不 同 产品 应 用 的 数据 布局 体系 。 


3. 本 地 数据 整合 的 常用 方法 

RDBMS (关系 型 数据 仓库 ) 仍然 是 目前 企业 数据 整合 的 主流 数据 结构 形式 ， 非 关系 型 数据 仓库 的 应 用 只 集中 在 部 分 互联 网 企业 ， 企 业 数 量 只 占 所 有 企业 的 一 小 部 分 。 

企业 数据 整合 时 ， 只 需 将 营销 数据 、 网 站 流量 数据 和 外 部 环境 数据 整合 到 企业 本 地 即 可 。 在 此 以 关系 型 数据 仓库 为 例 ， 介 绍 外 部 流量 相关 数据 的 数据 仓库 物理 模型 的 基本 逻辑 。 
(1) 典型 星 型 数据 仓库 模型 

星 型 数据 仓库 模型 是 一 种 由 中 间 单 一 对 象 向 外 辐射 并 连接 到 多 个 对 象 的 建 模范 例 。 该 模型 中 间 的 单一 对 象 是 唯一 的 “事实 表 ”,， 与 之 相连 的 对 象 称 为 “维度 表 ” 或 “ 维 表 ”.。 


i 事实 表 是 用 来 记录 发 生 了 茶 些 事实 的 数据 表 ， 表 中 通常 包含 数字 数据 (事实 ) 或 可 通过 汇总 计算 得 出 的 数据 ， 在 用 户 使 用 时 通常 是 作为 列 ， 即 指标 的 部 分 ， 如 销售 额 、 浏 览 量 、 登 录 次 数 ; 维 


度 表 是 用 来 记录 事实 表 中 事实 数据 的 描述 性 特性 ， 在 用 户 使 用 时 通常 是 作为 分 析 维 度 使 用 ， 如 产品 分 类 、 浏 览 器 类 型 、 地 域 、 推 广 模块 等 。 


接 


星 型 模型 的 事实 表 记录 了 所 有 的 日 志 数 据 ， 部 分 数据 在 数据 采集 时 已 经 被 处 理 成 具有 特定 代表 意义 的 数字 ， 这 些 数字 通过 维度 表 关 联 解释 。 星 型 模型 结构 如 图 6-14 所 示 。Adobe Analytics 的 数据 仓库 


结构 模型 为 典型 的 星 型 结构 ， 其 包括 1 个 事实 表 和 17 个 维度 表 (维度 表 的 具体 数量 会 随 着 Adobe Analytics 的 功能 调整 而 变化 ) 。 
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图 6-14 Adobe Analytics 的 星 型 模型 结构 


不 同 网 站 分 析 工 具 对 原始 日 志 的 处 理 不 同 ， 因 此 所 有 事实 表 和 维度 表 的 字段 也 不 尽 相 同 。 图 6-14 显 示 的 是 基于 Adobe Analytics 的 Data Feed 构 建 的 星 型 数据 仓库 模型 ， 其 中 的 一 条 原始 数据 格式 如 下 : 


zh-cn 29100000Uava-l.2-ANO0O02U0CNY 2 0.000000000000 0 460028469559100 1 2013-08-13 00: 00: 37 125.58.234.85 0 4.1.1 中 国 移动 2.2.7 860308028886394 WIFI 0bc916b5-382c-46 


原始 日 志 中 的 每 个 字段 都 代表 特定 的 含义 ， 日 志 数 据 中 包含 了 超过 ?500 个 字段 ( 列 ) ， 字 段 之 间 通 过 TAB 符 分 隔 ， 将 这 些 数据 导入 数据 仓库 就 形成 了 事实 表 数 据 。 


在 事实 表 的 第 二 列 ， 即 原始 日 志 的 第 二 个 字段 (zh-cn 后 的 值 为 291 字 段 ) ， 代 表 的 是 浏览 器 “Safari 1.2.3”。 其 他 类 似 的 字段 也 可 以 在 数据 对 照 表 即 维度 表 中 获得 ， 原 始 维度 表 的 部 分 数据 如 下 : 


Lynx 
Lynx 
Lynx 
Lynx 
Lynx 
Lynx (unknown version) 
Lotus Notes 4.5 

AOL 4.0 
AOLD 350 
Microsoft Internet Explorer 5.0 beta 2 


DID 
让 


; POOOJOOONRODP 


星 型 模型 数据 仓库 的 好 处 在 于 底层 数据 表 结 构 一 致 旦 字段 完整 ， 在 做 上 层 ETL 时 方便 程序 设计 ， 并 能 减少 数据 抽取 时 程序 复杂 程度 和 出 错 的 概率 ， 是 一 种 执行 效率 较 高 的 数据 结构 模型 。 这 种 模型 也 有 坏 
如 果 事 实 表 的 数据 量 过 大 会 导致 每 次 更 新 数据 时 压力 集中 并 发 ， 数 据 查询 的 响应 及 时 性 变 差 ， 同 时 由 于 数据 见 余 过 多 储存 效率 低 。 


~ 


星 型 模型 数据 仓库 适合 网 站 流量 较 小 的 网 站 ， 或 企业 初期 以 简单 数据 提取 和 整合 为 主 的 需求 ; 并 且 这 种 设计 模型 的 数据 提取 相对 简单 ， 更 加 利于 业务 导向 的 数据 仓库 应 用 ， 即 数据 仓库 搭建 完成 之 后 直 
提供 给 业务 方 使 用 。 


雪花 型 变 体 数 据 仓库 模型 
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、 系统 运 维 表 等 ) 。 不 同 数据 表 的 作用 如 下 : 


piwik_log_visit 是 网 站 中 的 有 关 访 问 属性 和 基本 访问 行为 的 数据 记录 ， 数 据 以 每 次 服务 器 
老 回访 、 距 离 第 一 次 或 最 后 一 次 订单 或 访问 的 时 间 、 


雪花 型 变 体 数据 仓库 模型 是 在 原 典型 的 雪花 型 基础 上 进行 的 变 体 ， 从 变 体 表面 看 仍然 是 围绕 
图 6-15 所 示 为 网 站 分 析 工 具 Piwik 的 底层 数据 结构 模型 。 


这 一 个 中 心 点 的 雪花 型 结构 ， 但 结构 中 的 所 有 表 都 具有 事实 和 维度 的 关系 ， 因 此 无 法 准确 区 分 事实 表 与 维度 
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图 6-15 


Piwik 的 底层 数据 结构 包括 6 个 数据 表 : piwik log visit、piwik log conversion、piwik log conversion item、piwik_goal、 


进入 来 源 、 关 键 字 、 总 转化 次 数 、 浏 览 器 


idactionrn Wrl 


雪花 型 变 体 数据 仓库 模型 


“ piwik_log_conversion 是 网 站 中 有 关 访 问 转 化 的 数据 ， 其 中 包含 电子 商务 转化 和 目标 转化 。 数 据 以 每 次 转化 为 记录 触发 周期 ( 即 只 有 转化 发 生 时 才 产 生 数 据 ) ， 
访问 频率 信息 、 地 域 信息 、 转 化 价值 信息 等 共 39 个 字段 。 
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piwik log link_visit action、piwik log action (除了 底层 数据 表 外 还 有 


请 求 (例如 一 个 页 面 、 一 次 订单 、 一 个 事件 追踪 等 ) 为 数据 粒度 ， 记 录 每 次 请 求 的 基本 信息 ， 如 访问 时 间 、 新 
自 


记录 了 转化 来 源 信息 、 新 老 访问 信息 、 


.Piwik_log_convetsion_item 可 以 理解 为 电子 商务 转化 数据 的 维度 表 数 据 (该 数据 表 也 具有 事实 表 特 征 : 记录 事实 信息 、 包 含 可 计算 汇总 的 数据 、 大 量 记录 数 、 更 新 频率 快 等 ) ， 数 据 包括 商品 分 类 、 


SKU、 价 格 、 数 量 等 。 


. piwik_goal 可 以 理解 为 转化 目标 的 维度 表 数 据 ( 跟 piwik_log_conversion_item 相 同 ， 该 表 也 具有 事实 表 特 征 ) ， 该 数据 表 以 目标 ID 为 主键 记录 数据 ， 包 括 匹配 类 型 、 目 标 名 称 、 是 否 大 小 写 敏 感 、 价 值 竺 


人 
六 .时 6 


* piwik_log link_visit_action 用 来 记录 每 次 访问 的 自 定义 信息 ， 如 自 定义 变量 、 服 务 器 请 求 时 间 、 各 种 来 源 页 面 的 ID 等 。 


. piwik_log_action 可 以 看 成 是 有 关 页 面 内 容 的 维度 表 ， 数 据 表 中 以 每 个 页 面 为 主键 进行 记录 ， 每 条 记录 代表 每 个 页 面 的 相应 属性 ， 包 含 页 面 ID、 名 称 、 哈 希 值 、 类 型 等 变量 。 


这 种 模型 的 好 处 是 将 典型 雪花 型 数据 仓库 中 唯一 的 事实 表 拆 分 成 围绕 访问 和 转化 的 事实 数据 表 ， 这 种 拆 分 可 以 避免 所 有 事实 在 一 个 表 中 的 数据 读 写 和 查询 时 的 响应 和 更 新 效率 问题 。 当 然 ， 该 数据 仓库 
模型 是 基于 Piwik 工 具 的 ， 适 用 于 数据 整合 和 应 用 场景 较为 复杂 的 企业 或 使 用 Piwik 的 企业 ， 在 具体 应 用 时 需要 根据 数据 特点 、 应 用 需求 等 做 进一步 调整 。 


(3) 混合 型 数据 仓库 模型 


混合 型 数据 仓库 模型 是 星 型 模型 和 雪花 模型 的 混合 模式 ， 大 多 数 企 业 在 业务 复杂 的 背景 下 ， 其 数据 仓库 模型 都 属于 混合 型 。 混 合 模 式 下 ， 所 有 的 用 户 行为 都 将 进行 拆 分 ， 并 按照 行为 属性 进行 事实 表 和 
维度 表 归 类 。 在 通常 情况 下 ， 事 实 表 分 为 引荐 来 源 事 实 、 搜 索 事 实 、 普 通 点 击 事实 、 购 物 车 事实 、 订 单 事实 、 表 单 事 实 、 媒 体 事实 等 ; 维度 表 分 为 访问 维 、 页 面 维 、 媒 体 维 、 时 间 维 、 推 荐 来 源 维 、 订 单 
维 、 自 定义 站 外 广告 维 、 自 定义 客户 维 、 自 定义 商品 维 等 。 


不 同事 实 表 数 据 组 成 如 下 : 


. 引荐 来 源 事 实 表 ， 记 录 每 一 次 请 求 的 引荐 来 源 ， 包 括 网 站 内 部 引荐 (页面 上 下 游 路 径 ) 和 外 部 引荐 〈 直 接 进 入 来 源 渠道 ) ， 记 录 了 每 次 请 求 的 请 求 ID 和 访问 ID、 引 荐 次 数 、 站 外 来 源 ID、 站 内 来 源 ID 


A 
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. 搜索 事实 表 ， 记 录用 户 搜索 行为 数据 ， 包 含 搜索 类 别 (站 内 搜索 还 是 站 外 搜索 ) 、 搜 索引 擎 (站 外 搜索 时 ) 、 搜 索 关 键 词 、 类 别 (如 果 存 在 ) 、 搜 索 次 数 、 搜 索 结 果 数 等 。 某 些 场景 下 ， 也 可 以 将 站 
外 搜索 单独 拆 分 出 来 与 引荐 来 源 事 实 表 合并 。 


. 普通 点 击 事实 表 ， 记 录用 户 页 面 行 为 〈 页 面 和 页 面 内 元 素 的 点 击 行为 ) ， 记 录 每 一 次 页 面 查看 的 页 面 ID、 元 素 ID、 和 触发 位 置 、 引 荐 来 源 、 次 数 、 用 户 信 息 等 。 
“ 购物 车 事实 表 ， 记 录 购 物 车 流程 页 面 数 据 ， 包 含 购 物 车 识别 ID、 购 物 车 内 商品 ID、 数 量 、 购 物 车 动作 〈 加 入 、 删 除 、 结 算 、 提 交 订 单 ) 、 总 价格 等 。 

. 订单 事实 表 ， 记 录 订 单数 据 ， 包 括 订 单 ID、 优 惠 信 息 ID、 数 量 、 商 品 ID、 总 价 
. 表单 事实 表 ， 记 录 表 单数 据 ， 包 括 表单 ID、 和 触发 次 数 、 表 单字 段 、 表 单 内 容 、 返 回 代 码 、 是 否 放弃 等 。 


不 同 的 自 定义 事件 一 般 都 归属 到 上 述 不 同类 别 的 事实 表 中 ， 除 此 之 外 ， 如 果 有 热力 图 功能 ， 还 会 包括 热力 图 事实 数据 ， 记 录 每 次 鼠标 点 击 的 请 求 ID、 访 问 ID、 次 数 、X 坐 标 、Y 坐 标 等 数据 ; 如 果 自 定义 
站 内 促销 跟踪 ， 会 包括 站 内 促销 事实 表 ， 用 来 记录 每 次 资源 位 的 点 击 数据 ， 包 括 促销 活动 |D、 活 动 类 型 、 周 期 、 起 止 时 间 、 点 击 位 置 、 次 数 等 。 


不 同 维度 表 的 数据 组 成 如 下 : 


` 访问 维 ， 记 录 每 次 访问 用 户 的 基本 属性 ， 包 括 唯一 用 户 识别 标识 (UV ID) 、 访 问 识别 标识 (Visit ID) 、 唯 一 设备 标识 (设备 ID) 、 叭 一 客户 标识 〈 登 录用 户 ID) 、 每 次 请 求 的 ID 标识 《请 求 ID) 、 


新 老 访客 、 访 问 次 数 、 操 作 系 统 、 浏 览 器 信息 、 是 否 支持 JS、 分 辩 率 、 磊 色 深 度 、 是 否 支 持 Cookie、 是 否 支 持 Java、 浏 览 器 语言 、 城 市 、 国 家 、ISP、 组 织 、 网 络 速 度 、 时 区 等 。 
` 页 面 维 ， 以 页 面 ID 为 主键 ， 定 义 页 面 ID 对 应 的 网 站 不 同 层 级 和 类 别 ， 如 某 A 商 品 的 产品 终端 页 对 应 了 页 面 类 型 (3C 页 面 ) 、 页 面子 类 型 (手机 页 面 ) 等 。 
. 媒体 维 : 用 来 拓展 站 内 的 媒体 信息 ， 包 括 媒 体 类 型 、 所 处 页 面 、 位 置 、 活 动 、 名 称 等 。 
.时间 维 ， 通 常 分 为 日 期 维度 和 时 间 维 度 两 个 表 ， 上 日 期 维度 表 以 日 期 为 主键 ， 对 应 周 、 周 几 、 星 期 、 季 度 、 年 等 ; 时 间 维 度 表 以 时 间 为 主键 ， 对 应 上 午 / 下 午 、 小 时 、 分 钟 、 秒 、 小 时 制 (12/24) 等 。 
* 推荐 来 源 维 表 是 Referral 表 ， 以 站 外 来 源 ID 为 主键 ， 用 来 表示 推荐 来 源 、 类 别 、 推 荐 网 站 的 具体 信息 等 。 
-订单 维 ， 是 订单 ID 对 应 的 配送 信息 〈 物 流 ID、 配 送 状 态 、 配 送 方式 ) 、 支 付 信息 〈 支 付 平台 、 支 付 银行 、 支 付 状态 ) 、 订 单 归 属 、 优 惠 促 销 信息 等 。 
" 自 定 义 站 外 广告 维 ， 是 自 定义 Campaign 信 息 的 扩展 表 ， 以 CampaignID 为 主键 ， 可 以 定义 Campaign 分 组 、 类 型 、 位 置 、 尺 寸 、 推 广 方式 、 付 费 形 式 、 推 广内 容 、 促 销 卖 点 等 。 
" 自 定义 客户 维 ， 以 CustomerID 为 主键 ,记录 登录 后 用 户 唯 一 识别 信息 如 用 户 ID， 该 ID 是 与 CRM 关 联 信息 的 主键 。 
. 自 定义 商品 维 ， 以 商品 ID (也 可 以 是 SKU) 为 主键 ， 扩 展商 品类 别 (一 、 二 、 三 级 ) 、 品 牌 、 名 称 ， 甚 至 可 以 包括 颜色 、 尺 码 等 自 定义 标签 和 属性 。 


6-16 所 示 为 Webtrekk 数 据 仓库 的 物理 模型 。 
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图 6-16 “混合 模型 数据 仓库 模式 


混合 模型 中 所 有 的 事实 表 和 维度 表 都 可 以 进 
度 较 大 。 


行 一 定 程度 的 再 次 拆 分 或 全 并， 这 种 模型 的 好 处 是 可 以 通过 减少 数据 元 余 来 提高 存储 利用 率 ， 但 问题 在 于 数据 间 的 关联 较为 复杂 ， 后 期 维度 以 及 用 户 访 问 难 


通常 只 有 在 大 型 企业 需要 做 完整 企业 数据 整合 将 企业 所 有 环节 完全 打通 ， 或 者 企业 要 基于 流量 数据 做 二 次 系统 开发 时 ， 如 站 内 推荐 系统 、 站 内 广告 竞价 等 ， 才 需要 如 此 细 粒 度 的 数据 利用 整合 及 应 用 。 


6.4 ”本 章 小 结 


本 章 介绍 了 企业 数据 整合 的 意义 、 范 畴 和 最 佳 方法 ， 需 要 读者 重点 掌握 的 知识 点 如 下 : 


` 网 站 数据 整合 的 范畴 ， 包 括 线 上 和 线 下 的 业务 数据 整合 、II 数 据 整 合 和 职能 数据 整合 ; 


* 在 线 和 本 地 数据 整合 的 基本 方法 及 最 佳 实 践 ， 重 点 是 企业 本 地 整合 时 的 流量 数据 仓库 的 搭建 。 


将 网 站 数据 集成 到 企业 本 地 的 工作 通常 需要 网 站 数据 分 析 师 完成 物理 模型 设计 、ETL 规 则 等 前 期 规则 工作 ， 建 议 读者 阅读 《数据 仓库 工具 箱 : 维度 建 模 的 完全 指南 》《 点 击 流 数据 仓库 》《Web 数 据 仓 
库 构建 指南 》 等 书籍 拓展 相关 知识 ; 另外 ， 建 议 初学 者 自行 安装 PIWIK 并 应 用 到 个 人 或 企业 网 站 ，PIWIK 由 于 是 开源 系统 ， 其 数据 仓库 基本 架构 已 经 搭建 完成 ， 具 有 编程 基础 的 读者 还 可 以 直接 阅读 其 源 代 
码 ， 以 增加 对 数据 ETL 的 理解 。 


在 企业 数据 整合 时 ， 按 照 工作 优先 级 及 数据 整合 的 紧迫 性 ， 不 同 阶段 的 整合 重点 如 下 。 


第 一 阶段 : 围绕 某 个 部 门 的 数据 整合 ， 该 部 门 通常 是 数据 需求 最 迫切 且 数 据 整 合 需求 最 高 的 部 门 ， 将 围绕 一 个 部 门 的 数据 整合 完成 是 最 优选 择 ， 通 常 这 个 部 门 是 会 员 部 门 或 网 站 部 门 。 


第 二 阶段 : 围绕 某 个 主题 的 数据 整合 ， 在 部 门 数 据 整合 的 基础 上 会 将 部 门 的 数据 进一步 完善 为 某 条 业务 线 的 数据 流 ， 通 常 是 会 员 业 务 流 、 商 品 业务 流 等 。 


第 三 阶段 : 围绕 完整 的 业务 数据 整合 ， 在 这 个 阶段 是 将 所 有 业务 数据 进行 整合 应 用 。 
在 以 上 阶段 中 ，1T 数 据 可 能 在 不 同 阶段 都 有 涉及 


及 ， 具体 根据 整合 对 象 的 需求 来 实现 。 在 实现 业务 数据 如 后 ， 即 第 三 阶段 之 后 ， 才 会 考虑 第 四 阶段 的 数据 整合 


第 四 阶段 : 完整 企业 数据 的 整合 ， 在 这 个 阶段 中 的 重点 数据 是 企业 财务 数据 ， 财 务 数据 是 每 个 企业 都 非常 敏感 且 关 键 的 数据 ， 因 此 对 于 安全 性 要 求 非常 高 。 这 要 求 数据 部 门 具备 极 高 的 数据 能 力 、 业 务 
理解 能 力 以 及 公司 的 信任 和 高 度 授权 才能 完成 


第 / 草 数据 监测 与 评估 指标 


虽然 商业 目标 不 同 ， 但 每 个 企业 都 会 围绕 最 终 商业 目标 开展 相关 业务 动作 。 在 这 个 过 程 中 ， 最 终 商 业 目标 以 及 每 个 业务 节点 的 阶段 性 完成 情况 是 企业 效果 评估 和 业务 优化 执行 的 参考 依据 。 本 章 将 介绍 
电子 商务 企业 通用 的 业务 数据 监测 与 评估 指标 ,涵盖 站 外 推广 、 站 内 运营 、 会 员 维护 、 仓 储 配 送 、 呼 叫 中 心 等 各 个 环节 。 


本 章 的 数据 指标 一 方面 可 用 于 企业 整体 和 各 业务 部 门 的 效果 评估 ， 以 把 握 发 展 趋势 ， 另 一 方面 也 可 通过 加 权 处 理 得 到 新 的 复合 指标 ， 并 通过 各 相关 业务 上 下 游 的 数据 指标 进行 漏斗 分 析 ， 以 便 找到 企业 
运营 环节 中 的 短 板 ， 为 下 一 步 优 化 执行 明确 方向 。 


加 ;说 整个 指标 体系 中 仅 包 含 业 务 执行 过 程 中 发 生 的 效果 考核 和 评估 指标 ， 不 包含 人 力 资 源 类 、 财 务 类 、IT 类 等 企业 运营 类 指标 ， 如 人 员 流 动 率 、 员 工薪 酮 、 办 公 管 理 费 用 、 员 工 食 宿 、 设 备 挫 销 和 
折 损 成 本 等 。 


7.1 ”业务 效果 潮 措 慰 


业务 效果 流 指标 指 除 成 本 和 收益 外 的 业务 效果 评估 指标 ， 包 括 站 外 推广 类 指标 、 网 站 运营 类 指标 、 企 业 会 员 类 指标 、 呼 叫 中 心 类 指标 、 仓 储 配送 类 指标 。 


7.1.1 ”站 外 推广 类 指标 
站 外 推广 类 指标 是 指 从 站 外 投放 媒介 获取 的 、 可 对 站 外 相关 广告 投放 效果 进行 评估 的 外 部 指标 ， 包 括 曝 光量 、 点 击 量 和 点 击 率 。 
1. 曝 光量 


广告 曝光 是 指 广告 在 站 外 对 用 户 展示 的 次 数 ， 广 告 曝光 量 又 称 广告 展示 量 。 从 技术 上 来 讲 ， 广 告 曝光 指 的 是 特定 广告 跟踪 代码 被 加 载 的 次 数 ， 每 加 载 一 次 就 产生 一 次 广告 曝光 。 
广告 曝光 量 是 衡量 广告 效果 的 初级 指标 ， 通 常用 来 衡量 展示 类 广告 。 广 告 曝光 并 不 意味 着 广告 一 定 会 被 用 户 看 到 ， 而 是 意味 着 广告 被 加 载 并 展示 出 来 ， 广 告 位 置 ( 首 屏 还 是 底部 ) 、 广 告 素材 、 广 告 形 
式 及 广告 周边 因素 等 因素 都 会 影响 到 用 户 的 注意 力 。 


VAN 


广告 点 击 量 是 指 站 外 广告 被 用 户 点 击 的 次 数 ， 每 点 击 一 次 就 记录 一 次 。 某 些 广告 投放 系统 如 蜂 梨 和 Adwords 等 会 对 无 效 点 击 进行 过 滤 ， 即 当 用 户 恶意 点 击 广 告 时 ， 恶 意 点 击 的 部 分 会 被 “忽视 ”， 只 保 
留 系统 认为 的 正常 点 击 数 据 。 这 会 导致 站 外 广告 系统 出 现 少 量 有 点 击 而 无 记录 的 情况 ， 影 响 站 内 网 站 分 析 工 具 与 站 外 广告 监测 数据 的 一 致 性 。 


@@ 江 齐 站 外 广告 监测 系统 与 网 站 分 析 工 具 监 测 到 的 广告 点 击 量 通常 不 一 致 ， 原 因 除了 上 述 无 效 点 击 过 滤 外 ， 还 包括 用 户 点 击 后 的 遗漏 监测 、 系 统 监 测 和 判断 逻辑 、 数 据 定义 规则 、 数 据 发 送 丢 失 等 因 
素 。 


3. 点 击 率 
广告 点 击 率 也 称 广告 点 击 通过 率 ， 常 用 CTR 表 示 。 点 击 率 的 计算 公式 为 : 


点 击 率 = 点 击 量 / 曝 光量 

点 击 率 是 衡量 站 外 广告 效果 的 重要 指标 ， 它 有 反映 了 用 户 对 当前 广告 的 喜好 程度 ， 也 反映 了 所 投放 的 媒介 用 户 质 量 与 投放 广告 的 匹配 度 。 通 常 ， 点 击 率 越 高 越 好 ， 但 过 高 的 点 击 率 也 可 能 意味 着 点 击 作 
洛 。 
7.1.2 ”网 站 运营 类 指标 

网 站 运营 类 指标 是 围绕 与 网 站 运营 相关 的 评估 指标 ， 包 括 网 站 页 面 运营 、 商 品 运 营 、 店 铺 运 营 和 等， 涵盖 了 网 站 流量 类 指标 、 网 站 目标 转化 类 指标 、 网 站 销售 类 指标 、 网 站 受 投 类 指标 、 网 站 商品 运营 类 
指标 、 网 站 店铺 运营 类 指标 。 

1. 网 站 流量 类 指标 


网 站 流量 类 指标 是 指 用 来 衡量 用 户 在 站 内 非 转化 类 行为 的 指标 ， 可 用 来 衡量 站 内 用 户 普 通 访问 行为 (主要 是 页 面 浏览 行为 ) ， 包 括 到 达 率 、UV、Visit、PV、 新 访问 占 比 、 访 问 深度 、 停 留 时 间 、 跳 出 / 
跳出 率 、 退 出 /退出 率 和 实例 数 。 


(1) 到 达 率 
到 达 指 用 户 从 站 外 广告 点 击 后 到 达 网 站 的 情况 ， 技 术 上 的 定义 为 用 户 从 带 有 站 外 标记 的 链接 点 击 进入 网 站 后 ， 触 发 站 内 跟踪 代码 的 次 数 ， 因 此 到 达 数 据 仅 发 生 在 针对 站 外 标记 广告 的 落地 页 。 


到 达 率 用 来 衡量 站 外 流量 到 达 网 站 的 比例 ， 计 算 公式 为 : 


到 达 率 指标 越 高 ， 说 明 在 广告 点 击 与 网 站 到 达 之 间 的 流失 越 少 。 不 同 广告 资源 的 到 达 率 情况 有 所 差异 : 通常 广告 类 到 达 率 较 低 ， 平 均 在 50%~80% 之 间 ; SEM 类 到 达 率 较 高 ， 在 80% 以 上 。 
Os 过 低 的 到 达 率 可 能 意味 着 用 户 质 量 较 差 或 网 站 着 陆 页 加 载 较 慢 ， 时 致 用 户 在 页 面 完 全 打开 前 直接 退出 或 数据 无 法 正确 统计 。 
(2) UV 


UV 即 Unique Visitor， 又 称 独立 访客 。UV 根 据 定义 时 间 的 不 同 可 分 为 每 小 时 UV、 每 日 UV、 每 周 UV、 每 月 UV 等 。 每 小 时 UV 定义 为 用 户 在 一 小 时 内 无 论 进入 网 站 多 少 次 或 打开 多 少 页 面 ， 都 只 计算 为 
1， 其 他 UV 计算 方法 类 似 。 


UV 是 衡量 用 户 “ 人 数 ”的 重要 指标 ， 反 映 了 来 到 网 站 的 用 户 “ 数 量 ”。 UV 定义 只 跟 时 间 有 关 ， 跟 其 他 任何 行为 都 没有 关系 。 
(3) Visit 
Visit 又 称 访问 量 或 访问 次 数 。Visit 定 义 与 UV 类 似 ， 只 不 过 大 多 数 Visit 的 默认 定义 时 间 为 30 分 钟 ， 即 用 户 在 30 分 钟 内 重复 打开 网 站 ，Visit 只 计 为 1;， 若 超过 30 分 钟 ， 则 记 为 一 次 新 的 访问 。 


Visit 是 衡量 次 数 的 重要 指标 ， 反 映 了 有 多 个 “人 次 ”来 到 网 站 ， 访 问 次 数 和 独立 访客 一 起 可 以 评估 网 站 来 了 多 少 “ 人 ”， 同 时 夭 性 如 何 。 如 一 个 网 站 每 天 的 UV 是 100 万 ， 但 访问 数 是 300 万 ， 反 映 了 网 
站 平均 每 个 UV 可 以 带 来 3 次 访问 。 


(4) PV 


PV 即 Page View， 又 称 页 面 浏览 量 、 页 面 曝 光量 ，PV 与 站 外 推广 类 指标 中 的 曝光 量 定义 相同 ， 区 别 在 于 PV 只 用 来 衡量 站 内 页 面 的 曝光 量 。 
(5) 新 访问 占 比 
新 访问 指 该 访问 为 用 户 的 第 一 次 访问 ， 而 之 前 并 没有 访问 记录 。 没 有 访问 记录 的 原因 可 能 是 用 户 没有 来 过 网 站 ， 也 可 能 是 之 前 来 访 的 Cookie 信 息 被 删除 。 


新 访问 占 比 用 来 定义 所 有 的 访问 中 新 访问 的 占 比 情况 。 新 访问 占 比 反映 了 站 外 渠道 或 网 站 吸引 新 用 户 的 能 力 ， 因 此 是 站 外 广告 投放 效果 评估 的 重要 指标 ， 尤 其 对 于 广告 类 以 吸引 新 用 户 关 注 为 目的 的 汇 
道具 有 重要 意义 。 新 访问 占 比 的 计算 公式 为 : 


新 访问 占 比 = 新 访问 量 / 总 访问 量 

@@ 让 示 如 果 用 户 在 当天 既 产 生 第 一 次 访问 ， 又 产生 第 二 次 访问 ， 网 站 分 析 系统 会 认为 该 用 户 既 属于 新 访问 又 属于 老 访 问 ， 并 在 计算 网 站 新 老 访问 量 时 分 别 加 1。 
(6) 访问 深度 

访问 深度 又 称 人 均 页 面 浏览 量 ， 用 来 评估 用 户 看 了 多 少 个 页 面 。 计 算 公式 为 : 

访问 深度 =PV/ 访 问 量 


访问 深度 是 用 户 访问 质量 的 重要 指标 ， 访 问 深度 越 大 意味 着 用 户 对 网 站 内 容 越 感 兴趣 ; 但 访问 深度 并 不 是 越 高 越 好 ， 过 高 的 访问 深度 可 能 意味 着 用 户 在 网 站 中 迷失 方向 而 找 不 到 目标 内 容 。 另 外 ， 在 某 
些 场景 下 ， 也 会 使 用 PV/UV 来 计算 人 均 浏览 页 面 数量 。 


(7) 停留 时 间 

襄 留 时 间 指 用 户 在 网 站 或 页 面 的 停留 时 间 的 长 短 。 计 算 公 式 为 : 
网 站 停留 时 间 = 最 后 一 次 请 求 时 间 稚 一 第 一 次 请 求 时 间 丽 

页 面 停留 时 间 = 下 一 个 页 面 请 求 时 间 丽 一 当前 页 面 时 间 堆 


训 留 时 间 的 计算 逻辑 是 两 个 时 间 截 的 差 值 ， 在 某 些 情况 下 这 种 计算 方法 将 失效 ， 如 退出 页 面 或 跳出 页 面 由 于 没有 下 一 个 时 间 礁 而 无 法 计算 停留 时 间 。 针 对 这 个 问题 ， 很 多 工具 提出 “心跳 监测 ”的 方 
法 ， 即 每 隔 一 段 时 间 (通常 是 30 秒 ) 页 面向 服务 器 发 送 请 求 。 如 果 用 户 在 当前 页 面 离开 网 站 ， 在 计算 该 页 面 停留 时 间 时 使 用 当前 页 面 最 后 一 次 请 求 的 时 间作 为 最 后 时 间 戳 来 计算 。 


通过 上 述 算法 可 以 看 出 ， 停 留 时 间 并 不 意味 着 用 户 真 的 “停留 ”在 页 面 上 浏览 网 页 ， 用 户 可 能 打开 网 页 后 离开 计算 机 ， 或 者 使 用 多 TAB 浏览 器 同时 打开 多 个 页 面 。 


另外 ， 对 于 停留 时 间 的 评估 也 不 是 越 高 越 好 。 一 个 简单 的 页 面 ， 如 果 用 户 停留 时 间 过 长 ， 可 能 意味 着 用 户 没有 注意 到 页 面 天 键 信息 或 没有 注意 到 引导 按钮 ， 从 而 降低 用 户 体验 或 降低 该 页 面 的 引导 贡 
献 。 


(8) 跳出 /跳出 率 

跳出 指 用 户 在 到 达 落 地 页 之 后 没有 点 击 第 二 个 页 面 即 离 开 网 站 的 情况 ， 跳 出 率 指 将 落地 页 作为 第 一 个 进入 页 面 并 在 访问 中 直接 跳出 的 访问 比例 。 计 算 公 式 为 : 
跳出 率 = 跳 出 的 访问 /落地 页 访问 

跳出 是 仅 针对 落地 页 而 言 的 指标 ， 用 来 评估 用 户 进入 网 站 后 的 第 一 反应 。 过 高 的 跳出 率 意味 着 站 外 流量 质量 低 或 页 面 设计 出 现 问题 ， 导 致 用 户 不 愿 继续 浏览 网 站 。 
(9) 退出 /退出 率 

退出 指 的 是 用 户 从 网 站 上 离开 而 没有 进一步 动作 的 行为 ; 退出 率 指 在 某 个 页 面 退 出 的 访问 占 该 页 面 总 访问 的 比例 。 计 算 公式 为 : 

退出 率 = 页 面 退出 的 访问 /页 面 总 访问 


退出 与 跳出 的 区 别 在 两 方面 : 一 是 跳出 针对 的 是 落地 页 ， 退 出 针对 网 站 所 有 页 面 ， 因 此 只 有 落地 页 才 有 跳出 率 ， 但 全 站 所 有 页 面 都 有 退出 率 (都 存在 成 为 离开 网 站 出 口 的 概率 ) ; 二 是 两 者 的 分 母 不 
同 ， 跳 出 率 的 分 母 是 将 落地 页 作为 登录 页 的 访问 量 ， 退 出 率 的 分 母 是 页 面 总 访问 量 (包含 作为 落地 页 和 非 沙 地 页 的 访问 量 ) 。 


在 通常 情况 下 ， 页 面 退出 率 越 低 越 好 ， 但 某 些 特殊 的 页 面 出 现 高 退出 率 也 属于 正常 情况 。 如 页 面 用 来 解决 用 户 的 某 个 问题 ， 当 用 户 需 求 得 到 满足 而 退出 网 站 属于 正常 情况 。 

(10) 实例 数 

实例 数 是 一 个 特殊 的 流量 指标 ， 用 来 衡量 站 内 自 定义 对 象 的 触发 次 数 。 实 例 数 的 技术 原理 是 每 次 监测 的 对 象 代码 触发 一 次 ， 则 实例 数 加 1。 

实例 数 通 常用 来 统计 站 内 自 定 义 对 象 ， 如 某 个 按钮 、 某 个 下 拉 菜 单 、 某 个 功能 区 等 ; 实例 数 在 统计 逻辑 上 类 似 于 页 面 浏览 量 。 理 论 上 ， 页 面 级 别 的 页 面 浏览 量 与 页 面 实例 数 相等 。 
2. 网 站 目标 类 转化 指标 


网 站 目标 类 转化 指标 用 来 衡量 网 站 目标 的 完成 和 转化 情况 ， 包 括 注册 、 加 入 购物 和 车、 下载 等 结果 类 目标 ， 这 些 结果 可 用 某 种 动作 来 度量 ; 也 包括 实现 这 些 目标 之 前 的 过 程 目 标 ， 如 要 加 入 购物 车 通常 需 
要 先 查 看 商品 详情 页 。 


(1) 产品 页 转化 率 
在 大 多 数 情况 下 ， 用 户 要 完成 订单 需要 先 浏览 产品 页 查看 相关 产品 信息 ， 确 认 信息 之 后 才能 继续 购物 车 流程 ， 因 此 浏览 产品 页 会 成 为 用 户 订单 转化 过 程 中 的 重要 指标 。 产 品 页 转化 率 的 计算 公式 为 : 


产品 页 转化 率 = 产 品 页 访问 量 /总 访问 量 


产品 转化 率 = 产 品 页 UV/ 总 UV 
关于 产品 页 转化 率 的 计算 既 可 以 使 用 访问 量 ， 又 可 以 使 用 UV， 不 同 公司 可 根据 实际 情况 应 用 。 


人 证 示 用 户 将 商品 加 入 购物 车 的 来 源 途径 通常 包括 活动 页 、 促 销 页 、 产 品 列表 页 、 超 市 页 、 会 员 中 心 等 具有 直接 加 入 购物 车 功能 的 页 面 。 在 大 多 数 情 况 下 购物 车 商品 来 源 集 中 在 产品 详情 页 ， 读 者 可 
根据 企业 自身 的 情况 加 以 区 别 。 


(2) 加 入 购物 车 转化 率 
加 入 购物 车 是 用 户 进 入 购物 车 环节 的 第 一 步 ， 用 户 在 该 步骤 确认 商品 信息 、 数 量 等 。 加 入 购物 车 转化 率 的 计算 公式 为 : 


加 入 购物 车 转化 率 = 加 入 购物 车 访问 量 /总 访问 量 


加 入 购物 车 转化 率 = 加 入 购物 车 UV/ 总 UV 


加 入 购物 车 转化 比 产品 页 转化 率 具有 更 高 的 参考 意义 ， 该 动作 意味 着 用 户 更 加 具有 购物 导向 性 。 因 此 ， 该 指标 会 用 来 衡量 所 有 站 外 营销 和 站 内 运营 的 业务 效果 。 加 入 购物 车 转化 率 高 ， 意 味 着 具有 购物 
意向 的 用 户 比 例 高 ( 作 蜂 情况 除外 ) 。 


(3) 结算 转化 率 
结算 是 用 户 购 物 车 环节 的 第 二 步 ， 用 户 在 该 步骤 确认 订单 联系 人 、 送 货 地 址 、 送 货 时 间 、 运 费 、 优 囊 折 扣 等 信息 。 结 算 转化 率 的 计算 公式 为 : 


结算 转化 率 = 结 算 访 问 量 / 总 访问 量 


或 
结算 转化 率 = 结 算 UV/ 总 UV 
结算 转化 率 越 高 意味 着 用 户 完 成 订单 的 概率 越 大 ， 因 此 它 也 是 网 站 相关 业务 部 门 的 重要 参考 指标 。 
(4) 下 载 转化 率 
很 多 网 站 都 有 资料 可 供用 户 下 载 ， 下 载 意 味 着 用 户 具 有 更 强 的 目标 性 或 针对 性 。 下 载 转化 率 的 计算 公式 为 : 
下 载 转化 率 = 下 载 访问 量 / 总 访问 量 
或 
下 载 转化 率 = 下 载 UV/ 总 UV 
如 果 网 站 存在 很 多 可 供用 户 下 载 的 业务 目标 ， 还 可 以 综合 评估 每 个 用 户 的 下 载 情况 ， 通 过 每 用 户 下 载 数量 = 下 载 量 / 访 问 量 (或 每 用 户 下 载 数量 = 下 载 量 /UV) 来 计算 。 
(5) 注册 转化 率 
注册 转化 率 是 以 会 员 获 取 为 目的 的 网 站 最 常 定义 的 目标 ， 注 册 转 化 率 的 计算 公式 为 : 
注册 转化 率 = 注 册 会 员 量 /总 UV 数 
由 于 注册 转化 率 的 计算 是 以 “人 ”为 单位 的 ， 因 此 这 里 分 母 使 用 UV 而 不 是 Visit。 
(6) 购物 车 内 转化 率 
购物 车 内 转化 率 与 其 他 指标 的 定义 维度 都 不 同 ， 该 指标 用 来 衡量 加 入 购物 车 的 用 户 中 完成 订单 的 比例 情况 。 计 算 公 式 为 : 
购物 车 内 转化 率 = 提 交 订 单 的 访问 量 / 加 入 购物 车 的 访问 量 
或 


购物 车 内 转化 率 = 提 交 订 单 的 UVV/ 加 入 购物 车 的 UV 
当 用 户 将 商品 加 入 购物 车 时 ， 意 味 着 用 户 具 有 较 强 的 购买 意愿 ， 如 果 用 户 中 途 放 弃 购 物 ， 则 产生 购物 车 放弃 率 ， 计 算 公 式 为 : 
购物 车 放弃 率 =1- 购 物 车 内 转化 率 


购物 车 内 转化 率 是 所 有 销售 类 电子 商务 网 站 的 重要 监控 指标 。 大 多 数 电 子 商 务 网 站 的 购物 车 内 转化 率 在 60% 以 上 ， 如 果 低 于 这 个 数据 说 明 流量 可 能 存在 作弊 问题 ， 或 购物 车 流程 设计 有 问题 ( 某 些 购买 
决策 周期 长 的 特殊 商品 除外 ， 如 保险 类 商品 ) 。 


除了 以 上 目标 外 ， 企 业 还 可 能 定义 的 转化 目标 包括 产品 收藏 、 商 品评 价 、 商 品 咨询 、 降 价 通知 等 用 户 行为 ， 这 些 都 是 用 户 转化 过 程 中 的 重要 节点 。 
3. 网 站 销售 类 指标 


网 站 销售 类 指标 是 指 电子 商务 类 转化 指标 ， 它 是 所 有 电子 商务 类 企业 最 关注 的 核心 业务 指标 。 销 售 类 指标 包括 订单 量 、 订 单 金额 、 每 订单 金额 、 商 品 销售 量 、 商 品 销售 额 、 件 单价 、 订 单 转化 率 、 支 付 
转化 率 等 。 


(1) 订单 量 


订单 量 指 用 户 提交 订单 的 数量 ， 计 算 逻 辑 去 重 后 订单 1D 的 数量 。 通 常情 况 下 ， 网 站 分 析 系 统 提供 的 订单 销售 数据 与 企业 内 部 销售 系统 数据 不 一 致 。 数 据 出 现 一 定 程度 的 误差 属于 正常 情况 ， 但 误差 比例 
不 宜 超 过 5% 且 误差 需要 相对 稳定 。 


(2) 订单 金额 
订单 金额 为 用 户 提交 订单 时 的 金额 ， 又 称 为 应 付 金额 。 计 算 公 式 为 : 


订单 金额 = 商品 销售 金额 + 运费 -优惠 凭证 金额 -其 他 折扣 (如 满 减 ) 
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运费 指 未 满足 免 邮 费 的 订单 需要 支付 的 配送 费用 ; 优惠 凭证 金额 指 通过 优 
真正 应 该 支付 的 金额 。 


(3) 每 订单 金额 


每 订单 金额 指 平均 每 个 订单 的 金额 ， 计 算 公 式 为 : 
每 订单 金额 = 订单 金额 /订单 量 


部 分 企业 在 网 站 分 析 工 具 中 将 每 订单 金额 作为 客 单价 使 用 ， 客 单价 指 每 个 用 户 的 下 单 金额 ， 是 以 用 户 为 计算 单位 的 ; 而 每 订单 金额 是 以 订单 为 单位 计算 的 ， 两 者 含义 不 同 。 


商品 销售 量 又 称 销售 件数 ， 指 订单 销售 商品 的 数量 。 如 某 个 订单 内 包含 A 和 B 两 种 商品 ， 人 商品 销量 为 1，B 商 品 销量 为 2， 那 么 该 订单 的 商品 销售 量 总 计 为 3。 
(5) 商品 销售 额 

商品 销售 额 是 指 商 品 销售 的 金额 ， 计 算 公 式 为 : 

商品 销售 额 = 商 品 销售 单价 X 销 售 数量 

商品 销售 额 与 订单 金额 的 区 别 在 于 没有 计算 任何 其 他 费用 或 优惠 金额 。 

(6) 件 单价 

件 单价 又 称 每 件 商品 价值 ， 指 每 个 商品 的 销售 价格 。 计 算 公式 为 : 

件 单价 = 商品 销售 金额 /商品 销售 量 

(7) 订单 转化 率 

订单 转化 率 是 电子 商务 网 站 最 重要 的 评估 指标 之 一 ， 大 多 数 网 站 分 析 工 具 的 计算 公式 为 : 


订单 转化 率 = 订 单 量 /总 访问 量 


订单 转化 率 = 订 单 量 /总 UV 量 


以 上 计算 方式 实际 上 不 科学 ， 原 因 是 它 衡量 的 不 是 人 的 转化 比例 。 假 如 其 中 包含 一 个 用 户 下 多 个 订单 或 网 站 存在 订单 拆 分 的 情况 ， 会 使 订单 量 要 大 大 高 于 实际 订单 人 数 ， 导 致 订单 转化 率 虚 高 。 正 确 的 
计算 方法 如 下 : 


订单 转化 率 = 产 生 订单 的 访问 量 /总 访问 量 


订单 转化 率 = 产 生 订 单 的 UV/ 总 UV 量 

(8) 支付 转化 率 

支付 转化 率 是 衡量 用 户 支 付 转化 的 数据 指标 ， 而 支付 是 用 户 完 成 购物 的 重要 步骤 。 计 算 公 式 为 : 
支付 转化 率 = 完成 支付 的 客户 数 / 需 要 支付 的 客户 数 


支付 转化 率 是 针对 选择 先 款 后 货 客 户 的 转化 评估 指标 ， 因 此 它 只 能 评估 订单 用 户 中 的 一 部 分 。 对 于 选择 货 到 付款 的 用 户 无 须 该 指标 评估 ， 用 户 会 在 配送 验证 的 时 候 支付 。 另 外 ， 由 于 每 个 订单 都 对 应 真 
实 的 客户 ， 因 此 这 里 用 客户 数 计算 支付 转化 率 。 


4. 网 站 受 投 类 指标 


网 站 妥 投 类 指标 是 线 下 妥 投 业务 最 重要 的 衡量 指标 之 一 ， 妥 投 意味 着 用 户 完成 收 货 ， 该 订单 流程 闭环 的 完成 。 网 站 有 尼 投 类 指标 包括 有 效 订 单 量 、 有 效 订单 金额 、 有 效 每 订单 金额 、 有 效 商 品 销售 量 、 订 
单 有 效率 、 有 效 商品 销售 额 、 有 效 件 单价 、 有 效 订 单 转化 率 。 


对 于 受 投 的 定义 ， 通 常 定 义 为 用 户 完成 收 货 。 实 际 上 ， 从 用 户 下 单 到 完成 收 货 通 常 需要 几 天 、 几 周 ， 偏 远 山 区 甚至 需要 几 个 月 的 时 间 ， 数 据 效果 评估 不 可 能 等 到 所 有 受 投 都 完成 才 进 行 。 因 此 ， 很 多 公 
司 会 使 用 新 的 指标 “有 效 ” 来 代替 “ 受 投 ”进行 慨 投 意义 上 的 效果 评估 ， 当 全 部 订单 慨 投 完成 后 ， 受 投 数据 指标 与 有 效 数据 指标 相等 ， 即 受 投 转化 率 等 于 有 效 转化 率 。 


订单 有 效 的 定义 为 排除 系统 作废 、 人 工作 废 、 用 户主 动 取消 、 未 支付 、 审 核 未 通过 等 无 效 订 单 状 态 ， 将 处 于 正常 进行 中 的 流程 状态 以 及 已 完成 的 订单 状态 都 归 为 有 效 状 态 。 该 定义 适用 于 以 下 所 有 “有 
效 ” 订 单 的 定义 。 


a 在 完成 妥 投 之 前 ， 处 于 过 程 中 的 有 效 状 态 会 一 直 变 化 ， 因 此 不 同时 间 点 对 相同 周期 内 的 有 效 订 单 评估 可 能 会 产生 不 同 的 结果 。 
(1) 有 效 订 单 量 

有 效 状 态 下 的 订单 数量 为 有 效 订单 量 ， 该 指标 仪 包含 订单 中 的 有 效 部 分 。 

(2) 有 效 订单 金额 

有 效 状 态 下 的 订单 金额 ， 该 指标 仪 包含 订单 中 的 有 效 部 分 。 

(3) 有 效 每 订单 金额 

用 来 衡量 有 效 状态 下 平均 每 个 订单 的 金额 ， 计 算 公式 为 : 

有 效 每 订单 金额 = 有 效 订 单 金额 /有 效 订单 量 

(4) 有 效 商品 销售 量 

有 效 状 态 下 的 商品 销售 量 为 有 效 商品 销售 量 ， 该 指标 中 仪 包含 订单 中 的 有 效 部 分 。 


(5) 订单 有 效率 


订单 有 效率 是 用 来 衡量 订单 有 效 比 例 的 重要 指标 ， 计 算 公 式 为 : 
订单 有 效率 = 有 效 订 单 量 /订单 量 


订单 有 效率 从 订单 发 生 时 随 着 时 间 开始 下 降 ， 直 到 所 有 订单 完成 妥 投 才 处 于 稳定 状态 。 大 多 数 电子 商务 企业 的 订单 有 效率 在 60% 以 上 ， 如 果 低 于 该 数值 说 明 订单 中 可 能 包含 大 量 作 浆 或 无 效 订单 。 与 订 
单 有 效率 相对 的 一 个 指标 是 “ 废 单 率 ”， 废 单 率 是 所 有 订单 中 作废 的 订单 比例 ， 计 算 公 式 为 : 


废 单 率 =1- 订 单 有 效率 
(6) 有 效 商品 销售 额 
订单 状态 为 有 效 的 商品 销售 金额 ， 仪 包含 有 效 订单 部 分 。 
(7) 有 效 件 单价 
有 效 件 单 价 指 有 效 状态 下 每 个 商品 的 销售 价格 ， 计 算 公式 为 : 
有 效 件 单 价 = 有 效 商 品 销售 金额 /有 效 商 品 销售 量 
(8) 有 效 订单 转化 率 
有 效 订单 转化 率 是 企业 最 真实 的 转化 效果 指标 ， 计 算 公式 为 : 


有 效 订 单 转 化 率 = 有 效 订 单 的 访问 量 / 总 访问 量 


有 效 订 单 转化 率 = 有 效 订 单 UV 量 /总 UV 量 
5. 网 站 商品 运营 指标 


网 站 商品 运营 指标 指 围 绕 网 站 商品 销售 相关 业务 进行 的 效果 评估 指标 ， 包 含 产生 上 下 架 、 产 品 促销 、 产 品 销售 等 业务 。 该 指标 包括 销售 任务 、 已 完成 销售 、 销 售 完成 比例 、 上 架 SKU 数 、 浏 览 SKU 数 、 
售卖 SKU 数 、 受 投 SKU 数 、 毛 利 、 毛 利率 。 


(1) 销售 任务 
销售 任务 指 企 业 对 销售 部 门 制定 的 目标 销售 任务 ， 销 售 任务 可 能 是 销售 额 、 订 单 金额 、 销 售 量 甚 至 是 毛利 等 。 销 售 任务 通常 包含 年 度 、 月 度 、 周 和 每 日 销售 任务 四 类 。 
(2) 已 完成 销售 
已 完成 销售 指 已 经 完成 的 销售 任务 ， 企 业 对 于 销售 完成 部 分 的 定义 通常 为 有 效 订 单 ， 甚 至 是 受 投 状态 的 订单 。 
(3) 销售 完成 比例 
销售 完成 比例 是 已 完成 销售 任务 占 销 售 任务 的 比例 ， 计 算 公 式 为 : 
销售 完成 比例 = 已 完成 销售 /销售 任务 
(4) 上 架 SKU 数 
上 架 通 常 指 商 品 在 网 站 上 具有 独立 的 信息 并 可 被 找到 。 上 架 是 商品 在 网 站 上 销售 的 第 一 步 ， 因 此 商品 上 架 比 例 是 商品 运营 的 重要 评估 指标 。 计 算 公式 为 : 
已 上 架 SKU 比 例 = 已 上 架 SKU 数 /库存 SKU 数 
合 尘 总 库存 SKU 数 通常 具有 多 种 定义 方法 ， 在 该 公式 中 最 广泛 的 定义 为 “库存 可 售卖 SKU 数 ”， 该 范围 的 定义 排除 了 库存 中 已 经 被 下 单 、 入 库 途 中 、 调 拨 途 中 等 不 可 用 的 商品 库存 数据 。 
(5) 浏览 SKU 数 
浏览 SKU 数 指 商品 页 面 被 用 户 浏览 过 的 SKU 数 ， 如 果 一 个 SKU 被 浏览 多 次 ， 则 只 计算 一 次 。 商 品 被 看 到 是 商品 售卖 的 第 二 步 ， 通 过 该 指标 ， 可 定义 出 浏览 SKU 比 例 ， 计 算 公式 为 : 


浏览 的 SKU 比 例 = 浏 览 SKU 数 /库存 SKU 数 


或 
浏览 的 SKU 比 例 = 浏 览 SKU 数 /上 架 SKU 数 
这 两 个 公式 的 区 别 在 于 分 母 不 同 ， 第 一 个 是 相对 于 企业 最 原始 的 库存 SKU 数 的 衡量 指标 ， 第 二 个 是 相对 于 业务 流程 上 一 步 的 衡量 指标 ， 都 具有 各 自 的 意义 。 
(6) 售卖 SKU 数 
售卖 SKU 数 指 被 用 户 订单 购买 的 SKU 数 ， 如 果 一 个 SKU 被 用 户 购 买 多 次 则 只 计算 一 次 。 同 样 的 ， 该 指标 也 可 定义 为 售卖 SU 比例 ， 计 算 公式 为 : 
售卖 SKU 比 例 = 售卖 SKU 数 /库存 SKU 数 
或 


售卖 SKU 比 例 = 售 卖 SKU 数 /浏览 SKU 数 


(7) 受 投 SKU 数 


妥 投 SKU 数 指 完 成 受 投 状态 的 商品 数 ， 该 状态 是 商品 最 终 有 效 的 唯一 定义 状态 ， 也 是 销售 业务 部 门 考核 中 使 用 最 多 的 指标 。 该 指标 也 可 定义 为 受 投 SKU 比 例 ， 计 算 公 式 为 : 


妥 投 SKU 比 例 = 妥 投 SKU 数 /库存 SKU 数 


妥 投 SKU 比 例 = 妥 投 SKU 数 /售卖 SKU 数 

(8) 毛利 
电子 商务 中 自 营 商品 最 重要 的 效果 指标 之 一 是 毛利 ， 毛 利 是 商品 利润 情况 的 最 重要 指标 ， 计 算 公式 为 : 
毛利 = 商品 妥 投 销售 额 -商品 批 次 进货 成 本 


全 汪 训 这 里 的 毛利 仅 指 销售 毛利 ， 即 通过 商品 进 销 差价 计算 的 毛利 ， 没 有 考虑 商品 促销 费用 、 配 送 费 用 、 活 动 推广 费用 及 其 他 摊 销 费用 ; 另外 ， 公 式 中 使 用 “商品 批 次 进货 成 本 ”计算 毛利 ， 原 因 是 
相同 的 商品 在 不 同 批 次 下 进货 成 本 可 能 不 同 ， 因 此 需要 使 用 相应 批 次 的 进货 成 本 。 


(9) 毛利 率 

毛利 率 是 考察 自 营 商 品 僵 利 情况 的 另外 一 个 最 重要 的 指标 ， 毛 利和 毛利 率 综合 反映 了 商品 的 盈利 规模 和 盈利 能 力 。 毛 利率 计算 公式 为 : 
毛利 率 -毛利 /商品 妥 投 销售 祝 

人 @@ 注 意 ”所 有 的 毛利 计算 基本 都 是 以 妥 投 状态 为 计算 准则 的 。 

除了 以 上 运营 指标 外 ， 还 包括 上 文中 提 到 的 所 有 销售 类 和 妥 投 类 指标 ， 在 此 不 重复 列举 。 

6. 网 站 店铺 运营 类 指标 

站 内 店铺 运营 类 指标 是 用 来 评估 平台 型 网 站 上 第 三 方 店铺 或 商家 的 指标 ， 包 括 招商 任务 、 已 完成 商家 数 、 招 商 完成 比例 、 初 始 化 店铺 数 、 浏 览 店铺 数 、 有 销售 店铺 数 、 佣 金额 、 佣 金 比例 和 GMV。 
(1) 招商 任务 

每 个 平台 都 有 招商 目标 ， 这 就 是 招商 任务 ， 包 括 入 驻 商家 数 、 打 款 商家 数 等 

(2) 已 完成 商家 数 

已 完成 商家 数 即 已 经 完成 招商 的 商家 数量 。 

(3) 招商 完成 比例 

招商 完成 比例 是 衡量 招商 任务 完成 度 的 指标 ， 计 算 公式 为 : 

招商 完成 比例 = 已 完成 商家 数 /招商 任务 

(4) 初始 化 店铺 数 

初始 化 店铺 数 指 的 是 在 平台 上 完成 初始 化 操作 的 店铺 ， 不 同 平台 对 初始 化 的 定义 不 同 ， 一 般 包括 登录 、 上 传 商 品 、 发 布 店铺 等 动作 。 
(5) 浏览 店铺 数 


浏览 店铺 数 是 相关 页 面 被 用 户 浏 览 的 店铺 数据 ， 同 一 个 店铺 被 用 户 浏览 多 次 或 浏览 多 个 页 面 ， 那 么 浏览 店铺 数 只 记 为 1。 店 铺 被 用 户 浏览 是 店铺 销售 的 第 一 步 ， 浏 览 店铺 数 可 衍生 出 浏览 店铺 比例 ， 计 算 
公式 为 : 


浏览 店铺 比例 = 浏览 店铺 数 / 初 始 化 店铺 数 
(6) 有 销售 店铺 数 
有 销售 店铺 数 指 有 销售 产生 的 店铺 数 ， 同 一 个 店铺 产生 多 次 销售 只 记 为 1。 有 销售 店铺 数 可 衍生 出 有 销售 店铺 比例 ， 计 算 公式 为 : 


有 销售 店铺 比例 = 有 销售 店铺 数 /初始 化 店铺 数 


有 和 销售 店铺 比例 = 有 销售 店铺 数 /有 浏览 店铺 数 
(7) 佣金 额 

佣金 是 平台 类 电 商 或 电 商 平台 业务 的 主要 盈利 点 之 一 ， 佣 金额 指 的 是 平台 从 商家 交易 额 中 抽取 的 提成 金额 。 
(8) 佣金 比例 

佣金 比例 是 指 佣金 额 占 成 交 额 的 比例 ， 计 算 公式 为 : 

佣金 比例 = 佣金 额 /成 交 总 额 
(9) GMV 


平台 类 电 商 业务 都 会 关注 GMV (Gross Merchandise Volume) ， 即 成 交 总 额 ，GMV 规 模 决 定 了 最 终 佣金 规模 的 大 小 。 另 外 ， 具 备 一 定 规模 的 GMV 配 合资 金 周 转 ， 可 使 企业 在 一 定时 间 内 拥有 相对 固 
定 的 资金 ， 这 些 资金 可 以 用 来 做 其 他 业务 投资 ， 因 此 GMV 是 平台 类 业务 最 重要 的 指标 之 一 。 


除了 以 上 运营 指标 外 ， 还 包括 上 文中 提 到 的 所 有 销售 类 和 受 投 类 指标 ， 在 此 不 重复 列举 。 

7.1.3 ”企业 会 员 类 指标 
会 员 类 指标 是 每 个 企业 都 非常 重视 的 数据 指标 。 除 整体 会 员 指 标 外 ， 根 据 会 员 生 命 周期 可 分 为 整体 会 员 指 标 、 购 买 新 老 会 员 指 标 、 老 会 员 复 购 指标 和 会 员 流 失 指 标 。 
1. 整 体会 员 指标 


整体 会 员 指 标 是 网 站 所 有 会 员 的 概览 性 指标 ， 该 指标 覆盖 会 员 的 “ 量 ” 和 “ 质 ” 的 评价 。 其 包括 总 注册 会 员 数 、 总 购买 会 员 数 、 整 体会 员 活 跃 度 和 可 营销 会 员 数 。 


总 注册 会 员 数 是 指 网 站 所 有 注册 会 员 的 总 量 ， 是 历史 会 员 的 累加 值 。 总 注册 会 员 数 反映 了 网 站 所 覆盖 的 整体 会 员 规模 。 
(2) 总 购 买 会 员 数 


总 购买 会 员 数 指 有 过 购买 行为 的 会 员 数量 (企业 也 可 以 根据 自身 转化 定义 为 其 他 要 素 ， 如 总 付费 会 员 数 等 ) 。 总 购买 会 员 数 是 历史 所 有 订单 会 员 数 量 的 总 和 ， 是 真正 给 企业 带 来 利润 的 群体 。 总 购买 会 
员 数 还 可 根据 妥 投 状态 衍生 出 “总 受 投 会 员 数 ”， 该 指标 包含 已 经 完成 受 投 的 会 员 。 


(3) 整体 会 员 活跃 度 


会 员 活跃 度 是 用 来 评价 当前 会 员 活 跃 度 情 况 的 指标 ， 通 常 以 会 员 动 作 或 关键 指标 作为 会 员 是 否 活 跃 的 标识 ， 如 是 否 登录 。 在 此 介绍 一 个 会 员 活跃 度 矩 阵 ， 通 过 业务 定义 〈 因 素 及 权重 可 根据 企业 自 
身 的 实际 情况 定义 ) 的 关键 因素 来 判断 整体 会 员 的 活跃 度 。 


表 7-1 列 出 了 所 有 会 员 关 键 动作 节点 和 指标 因素 ， 并 标识 了 每 个 因素 的 取 值 范围 及 权重 。 当 用 户 登 录 / 注 册 后 (标识 会 员 的 前 期 条 件 ) ， 所 有 会 员 的 行为 都 会 被 记录 下 来 ， 形 成 会 员 数 据 日 志 。 对 每 个 
员 的 活跃 度数 据 加 权 处 理 后 求 和 得 到 整体 会 员 活跃 度 得 分 。 计 算 公式 为 : 


整体 会 员 活 跃 度 = 注 册 X1+ 登 录 X1+ 了 验证 X1+ 等 级 数 X1+ 积 分 X1+…+ 商 品评 价 X1 

表 7-1 用 户 活跃 度 定义 表 
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举例 : 网 站 有 两 个 用 户 ， 其 中 一 个 会 员 完成 了 1 次 注册 、1 次 邮件 验证 (新 会 员 默 认 是 1 级 会 员 ) 、 查 看 2 次 商品 并 有 1 次 收藏 行为 ; 另 一 个 会 员 是 者 会员 (假设 为 2 级 会 员 ) ， 完 成 了 1 次 登录 、1 次 页 面 咨 
询 和 1 次 退货 订单 ， 那 么 该 网 站 (在 假设 只 有 2 个 会 员 ) 的 用 户 活跃 度 为 : 新 会 员 (1x1+1x1+2x2+1x2+1x1) + 老 会 员 (1x1+1x1-1x1+2x1) =12。 通 过 对 每 个 用 户 的 活跃 度 以 及 网 站 整体 活跃 度 的 计 
算 可 以 发 现 网 站 用 户 活跃 度 变化 趋势 。 


(4) 可 营销 会 员 数 


可 营销 会 员 数 是 指 整体 会 员 中 可 通过 一 定 方式 进行 会 员 营 销 以 满足 企业 特定 需求 的 会 员 数 量 。 会 员 营销 的 方式 可 能 包括 : 手机 号 、 邮 箱 、QQ、 微 信 等 ， 具 有 可 识别 并 可 接触 的 信息 点 ， 具 备 这 些 信息 中 
的 任何 一 种 便 能 成 为 可 营销 会 员 


2. 注 册 会 员 指 标 
注册 是 用 户 从 潜在 客户 到 企业 客户 的 必 经 阶段 ， 注 册 类 指标 包括 累计 注册 会 员 数 、 新 增 注册 会 员 数 、 新 增 激活 会 员 数 和 会 员 激 活 率 。 
(1) 累积 注册 会 员 数 


累积 注册 会 员 数 是 指 企 业 历史 所 有 注册 会 员 的 总 量 。 


投 率 、 


(2) 新 增 注册 会 员 数 
新 增 注册 会 员 数 是 指 企业 在 一 定 周期 内 新 增 注册 会 员 的 数量 。 

(3) 新 增 激活 会 员 数 

部 分 企业 要 求 会 员 注 册 后 必须 验证 才 可 称 为 企业 会 员 ， 新 增 激活 会 员 数 指 的 是 已 经 激活 验证 的 会 员 数 量 。 
(4) 会 员 激活 率 

会 员 激 活 率 指 的 是 注册 会 员 


经 完成 激活 的 会 员 比 例 ， 计 算 公式 为 : 


会 员 激 活 率 = 激活 会 员 量 /注册 会 员 量 
3. 购 买 新 / 老 会 员 指标 


购买 新 / 老 会 员 是 
新 / 老 会 员 


会 员 中 有 购买 行为 的 用 户 ， 该 指标 包括 累计 购买 新 / 老 会 员 数 、 新 增 购买 新 会 员 数 、 
员 下 单 量 、 新 / 老 会 员 受 投 量 、 新 / 老 会 员 下 单 量 慨 投 率 和 新 / 老 会 员 客 单 价 。 


受 投 新 / 老 会 员 数 、 新 / 老 会 


(1) 票 积 购买 新 / 老 会 员 数 

累积 购买 新 / 老 会 员 数 指 的 是 历史 所 有 有 购买 行为 的 新 会 员 的 总 和 。 
(2) 新 增 购买 新 会 员 数 

新 增 购买 新 会 员 数 指 的 是 企业 一 定 周期 内 有 购买 行为 的 新 会 员 数 。 


(3) 受 投 新 / 老 会 员 数 


员 受 投 率 


女 ] 又 人 于、 


新 / 老 会 员 下 单 金额 、 新 / 老 


股 新 / 老 会 员 数 指 的 是 已 经 完成 受 投行 为 的 新 会 会 员 数 。 不 同 公司 定义 的 受 投 状 态 有 所 差异 ， 具 体 可 参考 7.1.2 天 于 “ 受 投 类 指标 ”的 具体 信息 。 
(4) 新 / 老 会 员 妥 投 率 
新 / 老 会 员 受 投 率 指 的 是 下 单 的 新 / 老 用 户 中 已 经 完成 受 投 的 会 员 比 例 ， 计 算 公式 为 : 
新 会 员 妥 投 率 = 妥 投 新 会 员 数 /购买 新 会 员 数 
老 会 员 委 投 率 = 妥 投 老 会 员 数 /购买 老 会 员 数 
(5) 新 / 老 会 员 下 单 金额 
新 / 老 会 员 下 单 金额 指 的 是 新 会 员 或 老 会 员 的 下 单 金额 (任何 状态 的 订单 都 包含 在 内 ) 。 


(6) 新 / 老 会员 有 投 金额 


新 / 老 会 员 受 投 金额 指 的 是 已 经 完成 受 投行 为 的 新 会 员 或 老 会 员 的 订单 金额 。 


新 / 老 会 员 金 额 妥 投 率 指 的 是 新 / 老 会 员 


已 经 完成 受 投 的 金额 占 下 单 金额 的 比例 ， 计 算 公式 为 : 


(8) 新 / 老 会 员 下 单 量 


新 / 老 会 员 下 单 量 指 的 是 新 会 员 或 老 会 员 的 下 单数 量 (任何 状态 的 订单 都 包含 在 内 ) 。 


几时 
里 


(9) 新 / 老 会 员 有 溉 投 


新 / 老 会 员 受 投 量 指 的 是 已 经 完成 受 投 行为 的 新 会 会 员 的 受 投 订单 数量 。 


(10) 新 / 老 会 员 下 单 量 受 投 率 


新 / 老 会 员 下 单 量 妥 投 率 指 的 是 新 / 老 会 员 已 经 完成 妥 投 的 订单 量 占 下 单 量 的 比例 ， 


新 会 员 订单 量 妥 投 率 = 新 会 员 妥 于 入 订单 量 / 新 会 员 订单 量 


老 会 员 订 单 量 妥 投 率 = 老 会 员 妥 投 订单 量 / 老 会 员 订 单 量 


(11) 新 / 老 会 员 客 单价 


新 / 老 会 员 客 单价 指 平均 每 个 新 会 员 或 老 会 员 带 来 的 客 单价 ，i 


新 会 员 客 单价 = 新 会 员 订 单 金额 /新 会 员 


订单 
订单 金额 / 老 会 员 订 单 


二 


除 此 以 外 还 可 以 定义 新 / 老 会 员 受 投 客 单价 ， 用 来 评估 已 经 完成 受 投 的 新 / 老 会 员 的 客 单价 水 平 。 


4. 老 会 员 复 购 指标 


老 会 员 复 购 是 衡量 网 站 会 员 黏 性 和 会 员 价值 的 重要 指标 ， 包 括 复 购 率 和 复 购 频次 。 


(1) 复 购 率 


会 品 了 要 


会 员 女 


投 金额 、 新 / 老 会 员 金 额 妥 


复 购 率 是 一 定 周 期 内 购买 两 次 或 两 次 以 上 的 会 员 比 例 。 不 同 公司 对 复 购 


第 一 种 : 1 个 月 内 购买 两 次 或 两 次 以 上 的 会 员 


第 二 种 : 1 个 月 内 购买 两 次 或 两 次 以 上 的 会 员 占 所 有 会 员 的 比例 ， 以 及 1 


第 三 种 : 1 个 月 之 前 有 购买 行为 ，1 个 月 之 内 又 有 购买 行为 的 会 员 


以 上 三 种 定义 方式 可 根据 企业 的 自身 情况 进行 调整 ， 同 时 1 个 月 的 时 间 周 期 也 可 根据 商品 或 服务 销售 频次 进 


(2) 复 购 频次 
除了 复 购 率 ， 还 可 以 定义 复 购 频 次 ， 如 过 去 一 周 中 复 购 2 次 、3~5 次 、6~ 


会 员 ; 


企业 经 营 和 管理 中 的 重要 工作 ， 流失 指标 包括 会 员 ; 


已 
日 


冰 
加 
it 
外 
冰 


员 不 再 购买 企业 相关 业务 或 商品 ， 


率 的 定义 有 所 差异 ， 基 本 定义 逻辑 分 为 三 种 ， 现 以 1 个 月 作为 时 间 周 期 定义 复 购 情况 。 


是 1 次 ) 的 会 员 


个 月 之 前 有 购买 行为 ， 在 1 个 月 之 内 又 产生 购买 行为 (可 能 


行 重新 定义 。 


10 次 、11 次 以 上 客户 的 占 比 情况 。 


DIL 充 失 率 、 会 员 异 动 比 等 。 


会 员 数 量 与 全 部 有 购买 行为 的 会 员 数 量 间 的 比例 。 计 算 公式 为 : 


(2) 会 员 寞 动 比 

会 员 异 动 比 指 新 增 购 买 会 员 与 流失 会 员 之 间 的 比例 关系 ， 计 算 公式 为 : 

会 员 异 动 比 = 新 增 购买 会 员 / 流 失 会 员 

如 果 会 员 异 动 比 等 于 1， 说 明 企业 在 一 定 周 期 内 新 增 会 员 与 流失 会 员 数 相等 ; 如 果 大 于 1， 说 明 新 增 会 员 多 于 流失 会 员 ， 这 是 良好 的 发 展 状 态 ; 如 果 小 于 1， 说 明 会 
员 枯 竭 危 机 。 
7.1.4 ”呼叫 中 心 类 指标 


呼叫 中 心 类 指标 是 企业 售后 服务 和 呼叫 中 心 相关 业务 部 门 的 评估 指标 ， 

1. 呼 叫 接 入 类 指标 

呼叫 接 入 类 指标 是 呼叫 者 在 接 入 电话 之 前 的 评估 指标 ， 包 括 总 呼叫 量 、 
(1) 辟 呼 叫 量 

总 呼叫 量 指 所 有 打 入 呼叫 中 心 的 电话 数量 ， 包 括 受 到 阻塞 的 、 中 途 放 弃 

(2) 接 通 率 


接 通 率 用 来 衡量 电话 接 通 情况 ， 包 含 呼 入 接 通 率 和 呼出 接 通 率 两 种 情况 。 


呼 入 接 通 率 指 的 是 所 有 已 经 接 通 的 呼 入 电话 量 (包括 通过 IVR 即 互动 式 语音 应 答 系统 和 人 工 接 通 两 种 ) 占 总 呼叫 量 的 比例 ， 呼 出 接 通 率 指 的 是 坐席 呼出 电话 后 接 通 量 与 呼出 电话 总 量 的 比例 。 


呼 入 接 通 率 = (IVR 接 通 量 + 人 工 接 通 量 ) /总 呼 入 电话 量 

呼出 接 通 率 = 呼出 成 功 接 通 量 /总 呼出 电话 量 

(3) 占 续 率 

占线 率 用 来 衡量 呼叫 占线 的 情况 。 计 算 公 式 为 : 

占线 率 = 〈 通 话 时 间 + 桂 线 时 间 ) / (通话 时 间 + 持 线 时 间 + 闲 置 时 间 ) 
(4) 呼叫 放弃 率 

呼叫 放弃 率 指 的 是 呼叫 业务 已 经 被 接 通 到 呼叫 中 心 ， 但 又 被 呼叫 者 在 接 
呼叫 放弃 率 = 放 弃 电 话 次 


数 / 全 部 接 通电 话 的 次 数 


(5) 平均 排队 时 间 


平均 排队 时 间 是 指 呼 叫 者 被 呼叫 系统 (比如 ACD，Automatic Call Distributor 自 动 呼叫 分 配 设 备 ， 也 叫 智能 选 


(6) 平均 响 铃 次 数 
响 铃 次 数 指 呼叫 者 听 到 回话 之 前 电话 铃 振 响 的 次 数 ， 该 响 铃 由 客服 代表 
2. 呼 叫 处 理 类 指标 
呼叫 处 理 类 指标 是 用 来 衡量 呼叫 业务 处 理 过程 的 指标 ， 包 括 平均 处 理 时 h 


(1) 平均 处 理 时 间 
平均 处 理 时 间 指 坐席 处 理 与 呼 入 者 的 谈话 时 间 、 持 线 时 间 及 事后 处 理 同 


平均 处 理 时 间 = 总 处 理 时 间 / 接 通电 话 量 


包括 呼叫 接 入 类 指标 、 呼 叫 处 理 类 指标 和 呼叫 结果 类 指标 。 


接 通 率 、 占 线 率 、 呼 叫 放弃 率 、 平 均 排队 时 间 、 平 均 响 铃 次 数 等 。 


的 和 已 经 答复 的 电话 。 


通 之 前 主动 挂 断 电话 的 比例 。 计 算 公式 为 : 


择 坐 席 ) 列 入 名 单 后 
或 IVR 产生 ， 


平均 响 铃 次 数 是 平均 每 个 呼叫 者 接 通 之 前 的 响 铃 次 数 。 


间 、 一 次 性 问题 解决 率 、 监 听 合 格 率 。 


电话 相关 工作 内 容 的 平均 时 间 。 计 算 公式 为 : 


员 的 增长 不 如 流 


等 待人 工 坐席 回答 的 平均 等 待 时 长 。 


快 ， 


企业 将 面临 会 


(2) 一 次 性 问题 解决 率 

一 次 性 问题 解决 率 指 呼叫 者 当 次 接 通电 话 后 即 解决 问题 的 比例 ， 不 需要 呼 入 者 再 次 拨 入 呼叫 中 心 ， 也 不 需要 坐席 回 拨 电 话 或 转 接 。 计 算 公 式 为 : 

一 次 性 问题 解决 率 = 一 次 性 问题 解决 电话 量 /呼叫 电话 总 量 

(3) 监听 合格 率 

监听 合格 率 指 通过 电话 录音 等 手段 抽查 或 监听 坐席 服务 质量 的 合格 率 ， 不 同 企业 对 于 合格 的 定义 不 同 。 

3. 呼 叫 结果 类 指标 

呼叫 结果 类 指标 包括 呼出 量 、 成 功 呼 出 量 、 呼 出 成 功率 、 呼 叫 满意 度 。 

(1) 呼出 量 

呼出 量 指 坐 席 在 一 定时 间 (如 每 天 、 每 周 、 每 月 等 ) 内 呼出 的 电话 量 ， 呼 出 电话 量 通常 是 针对 呼出 项 目 制定 的 KPI1， 其 目的 包括 会 员 维护 、 解 决 问题 、 产 品 推销 、 活 动 介 绍 等 。 
(2) 成 功 呼出 量 


成 功 呼 出 量 是 指 坐席 在 一 定时 间 (如 每 天 、 每 周 、 每 月 等 ) 内 成 功 呼 出 的 电话 量 。 不 同 企业 对 于 成 功 的 定义 不 同 ， 常 见 的 “成 功 ” 定 义 包 括 : 电话 接 通 、 通 话 时 间 超 过 30 秒 、 业 务 预定 、 参 与 活动 、 完 
成 订购 等 。 


(3) 呼出 成 功率 
呼出 成 功率 是 坐席 呼出 成 功 电话 量 的 比例 ， 计 算 公式 为 : 
呼出 成 功率 = 成 功 呼 出 量 /呼出 总 量 

(4) 呼叫 满意 度 


呼叫 满意 度 是 指 呼 入 者 对 呼叫 中 心 提 供 服务 的 满意 程度 ， 不 同 企业 对 于 满意 度 的 评价 方式 不 同 。 如 果 呼 叫 满意 度 打 分 只 有 满意 和 不 满意 ， 那 么 满意 度 的 结果 是 一 个 比例 ， 即 满意 呼叫 占 比 。 计 算 公 式 


如 果 呼 叫 满意 度 打分 分 为 几 个 等 级 ， 如 满意 、 一 般 、 不 满意 ， 可 以 将 不 同 满意 程度 按照 加 权 计算 ， 例 如 满意 2 分 ; 一 般 0 分 ; 不 满意 -2 分 (具体 分 值 可 以 自 定义 ) 。 假 设 有 两 个 电话 分 别 是 满意 和 一 般 ， 
那么 呼叫 满意 度 为 2+0=2。 满 意 度 结果 是 一 个 数值 ， 可 通过 设 定 不 同 阶段 的 满意 度 参 考 标准 来 评价 满意 度 的 增长 或 下 降水 平 。 


除 以 上 三 大 类 指标 外 ， 还 可 包括 平均 放弃 时 间 、 平 均 话 后 处 理 时 间 、 通 话 应 答 速度 、 转 移 电 话 量 、 转 移 呼叫 率 、 投 诉 率 、 等 呼叫 过 程 指标 。 
7.1.5 仓储 配送 类 指标 

仓储 配送 类 指标 是 针对 仓储 配送 作业 的 评估 指标 ， 是 销售 类 企业 重要 的 关注 点 。 仓 储 配 送 类 指标 包括 仓储 吞吐 指标 、 仓 储 库存 指标 、 仓 储 效率 指标 、 仓 储 物 流 指标 。 
1. 仓 储 吞吐 指标 

仓储 吞吐 指标 用 来 衡量 仓储 的 吞吐 能 力 ， 包 括 入 库 量 、 出 库 量 、 直 拨 量 、 吞 吐 量 和 出 /入 库 差 错 率 。 

(1) 入 库 量 

入 库 量 指 商品 入 库 的 数量 。 

(2) 出 库 量 

出 库 量 指 商品 出 库 的 数量 ， 包 括 以 物流 配送 形式 出 库 和 用 户 自 提出 库 的 数量 。 

(3) 直拨 量 

在 部 分 情况 下 ， 商 品 可 能 未 经 过 仓库 由 上 游 广 商 直接 调拨 给 用 户 ， 这 算是 直拨 量 。 

(4) 吞吐 量 

仓库 吞吐 量 是 所 有 出 入 库 商 品 数量 的 综合 ， 计 算 公式 为 : 

吞吐 量 = 出 库 量 + 入 库 量 + 直拨 量 

(5) 出 /入 库 差 错 率 

出 /入 库 差 错 率 指 的 是 出 /入 库 过 程 中 发 生 错误 的 比例 ， 计 算 公式 为 : 

出 库 差 错 率 = 出 库 差 错 次 数 /总 出 库 次 数 

入 库 差 错 率 = 入 库 差错 次 数 / 总 入 库 次 数 

2. 仓 储 库存 指标 
仓储 库存 指标 用 来 评估 仓储 的 本 情况 ， 包 括 仓库 数量 、 仓 库容 量 、 库 存 金额 、 库 存 可 用 天 数 、 库 存量 、 库 龄 、 滞 销 金额 、 缺 货 率 、 残 次 数量 、 残 次 金额 、 残 次 占 比 。 
(1) 仓库 数量 


仓库 数量 反映 了 企业 可 以 容纳 商品 库存 的 能 力 ， 同 等 条 件 下 仓库 数量 越 多 库存 能 力 越 高 。 仓 库 根据 规模 或 业务 的 作用 不 同 会 有 等 级 划分 ， 常 见 的 大 型 企业 会 在 全 国 划分 几 个 物流 中 心 ， 物 流 中 心 会 辐射 
周边 的 仓库 ; 或 者 全 国有 几 个 一 级 仓库 ， 每 个 一 级 仓库 也 都 有 自己 辐射 的 二 级 仓库 。 


仓库 容量 是 库存 能 力 的 重要 评估 标准 ,仓库 容量 包括 仓库 面积 和 仓库 体积 两 方面 。 在 同等 仓库 数量 的 前 期 下 ,仓库 可 用 面积 或 体积 越 大 ， 库 存 能 力 越 高 。 所 有 仓库 容量 (面积 或 体积 ) 相 加 可 得 到 企业 
整体 的 仓库 容量 。 


二 


库存 金额 是 全 部 库存 产品 按 入 库 成 本 价格 计算 的 总 金额 。 除 总 金额 外 ， 还 可 能 会 有 平均 库存 金额 ， 平 均 库 存 金额 通常 取 期 初 和 期 末 的 平均 值 ， 计 算 公 式 为 : 

平均 库存 金额 = (期 初 库存 金额 + 期 末 库 存 金 额 〉/2 

如 月 初 库存 金额 为 2000 万 元 ， 月 末 库 存 金额 为 2200 万 元 ， 平 均 库 存 金额 为 2100 万 元 。 

(4) 库存 可 用 天 数 

库存 可 用 天 数 反 映 了 当前 库存 可 以 满足 供应 的 天 数 ， 是 仓库 备货 能 力 的 一 个 体现 。 计 算 公式 为 : 

库存 可 用 天 数 = 库 存 商品 数量 /期 内 每 日 商品 销售 数量 

库存 可 用 天 数 越 长 代表 可 用 时 间 越 多 ， 但 过 长 的 可 用 天 数 可 能 意味 着 商品 滞销 ， 因 此 库存 可 用 天 数 需 要 保持 在 一 定 的 范围 内 。 

库存 可 用 天 数 通 常会 按照 时 间 进行 划分 ， 不 同 商品 的 可 用 天 数 需要 根据 库存 周转 天 数 来 定义 ， 如 果 商 品 库存 周转 天 数 是 30 天 ， 那 么 可 以 将 库存 天 数 划分 为 7 天 以 内 、8~ 14 天 、15~30 天 、30 天 以 上 等 。 
(5) 库存 量 


库存 量 是 指 一 定 周 期 内 全 部 库存 商品 的 数量 。 库 存量 的 定义 中 包括 多 种 状态 的 商品 ， 如 : 正常 可 售卖 商品 、 已 被 订购 但 未 发 货 商 品 、 残 次 商品 、 调 拨 未 出 库 商 品 、 调 拨 未 入 库 商 品 等 。 因 此 ， 某 些 情况 


， 可 能 出 现 商品 有 库存 但 无 法 销售 的 情况 。 


企业 通常 会 定义 安全 库存 量 、 最 低 库存 量 和 最 高 库 人 存量， 目的 是 保证 商品 在 一 定 程度 上 可 满足 用 户 购 买 需求 ， 同 时 不 至 于 造成 商品 积压 。 如 果 低 于 最 低 库 存量 可 能 造成 商品 缺 货 ， 高 于 最 高 库存 量 可 能 


安全 库存 量 = 每 日 商品 销量 X 正 常 到 货 时 间 (天 ) +P 


最 低 库存 量 = 每 日 商品 销量 X 紧急 到 货 时 间 (天 ) +P 


最 高 库存 量 = 每 日 商品 销量 X 最 长 到 货 时 间 (天 ) +P 

其 中 的 P 为 调节 参数 ， 包 含 企业 销售 任务 、 节 假日 因素 、 仓 储 运 维 等 因素 。 

(6) 库 龄 

仓储 中 的 商品 从 进入 仓库 开始 就 产生 库 龄 ， 一 般 意 义 上 的 库 龄 指 的 是 商品 库存 时 间 。 库 龄 计算 公式 为 : 

库 龄 = 出 库 时 间 - 入 库 时 间 

仓储 系统 中 按照 先进 先 出 、 先 进 先 销 的 原则 出 库 ， 因 此 同一 种 商品 的 库 龄 要 按照 其 相应 的 进货 批 次 的 时 间 计 算 。 

库 龄 通常 会 按照 时 间 进 行 分 类 ， 如 1~30 天 库 龄 、31~60 天 库 龄 、61~ 90 天 库 龄 等 ， 不 同 商品 周转 天 数 不 同 ， 划 分 时 间 段 也 有 所 差异 。 库 龄 时 间 过 长 意味 着 商品 进入 滞销 ， 即 无 法 卖 出 的 阶段 。 
(7) 滞销 金额 

滞销 是 指 商品 周转 天 数 超过 其 应 该 售卖 的 周期 ， 导 致 无 法 销售 出 去 的 情况 。 

滞销 金额 可 以 衍生 出 滞销 金额 占 比 、 滞 销 SKU 占 比 、 灌 销 商 品 销量 占 比 等 指标 ， 各 指标 计算 逻辑 类 似 ， 以 滞销 金额 占 比 为 例 ， 计 算 公 式 为 : 
销售 金额 占 比 = 滞销 金额 /库存 金额 

清 销 一 方面 会 造成 资金 积压 影响 资金 流动 ， 另 一 方面 会 造成 产品 过 季 、 过 保质 期 或 淘汰 周期 而 导致 产品 损坏 或 下 市 。 


(8) 缺 货 率 


区 
拉 
。。 


缺 货 是 相对 于 滞销 的 另 一 个 极端 ， 缺 货 意味 着 库存 商品 无 法 满足 用 户 的 购买 需求 。 缺 货 率 计算 公式 


缺 货 率 同样 可 以 衍生 其 他 指标 ， 如 缺 货 金额 、 缺 货 商品 数量 等 。 计 算 公式 为 : 


(9) 残 次 数量 

残 次 指 的 是 由 于 商品 库存 、 搬 运 、 装 卸 、 物 流 、 销 售 等 主 、 客 观 原因 造成 的 商品 外 包装 损坏 、 产 品 损坏 、 附 件 丢 失 等 影响 商品 二 次 销售 的 情况 ， 残 次 数量 指 残 次 商品 的 数量 。 
(10) 残 次 金额 

残 次 金额 指 残 次 商品 的 进货 成 本 ， 计 算 公式 为 : 

残 次 金额 = 残 次 商品 批 次 进货 单价 X 残 次 商品 数量 

(11) 残 次 占 比 

残 次 占 比 用 来 衡量 残 次 商品 在 整个 仓库 中 所 占 的 比例 ， 包 括 残 次 金额 占 比 和 残 次 数量 占 比 计算 公式 为 : 


残 次 金额 占 比 = 残 次 商品 金额 /库存 商品 金额 


残 次 数量 占 比 = 残 次 商品 数量 /库存 商品 数量 

3. 仓 储 效率 指标 

仓储 效率 指标 包括 库存 周转 率 、 库 存 周 转 天 数 、 仓 库 利用 率 

(1) 库存 周转 率 

库存 周转 率 又 称 库存 周转 次 数 ， 是 商品 销售 出 库 数 量 与 库存 商品 平均 数量 的 比 。 库 人 存 周转 率 有 两 种 定义 方式 ， 计 算 公 式 为 : 


库存 周转 率 = 销 货 数量 /( (期 初 商品 库存 数量 + 期 末 商 品 库存 数量 ) /2) 


库存 周转 率 = 销 货 成 本 / ( (期 初 商品 库存 金额 + 期 末 商 品 库存 金额 )/2) 


第 二 个 公式 中 的 销 货 成 本 ， 从 业务 角度 来 说 指 销售 商品 金额 ， 这 种 方式 更 容易 计算 ; 从 财务 角度 来 说 通常 还 会 包括 销 货 时 所 需 的 其 他 费用 和 成 本 ， 这 种 方式 可 以 直接 反映 出 企业 的 利润 情况 ， 但 财务 计 
算 的 流程 和 付费 所 需 时 间 比 较 长 ， 因 此 不 能 实时 反馈 数据 。 


库存 周转 率 是 仓储 物流 业务 最 关注 的 指标 之 一 ， 库 存 周转 率 越 高 ， 意 味 着 商品 进出 越 频 繁 ， 同 等 情况 (如 利润 率 、 成 本 等 不 变 ) 下 ， 企 业 收 益 越 高 。 从 实际 情况 看 ， 库 存 周转 率 过 快 ， 可 能 意味 着 缺 
货 ; 库存 周转 率 过 慢 ， 可 能 意味 着 商品 沾 销 。 


(2) 库存 周转 天 数 
库存 周转 天 数 是 用 时 间 表 示 库 存 的 周转 速度 ， 计 算 公式 为 : 
库存 周转 天 数 =360/ 库 存 周 转 率 
(3) 仓库 利用 率 
仓库 利用 率 包 括 仓库 面积 利用 率 和 仓库 容积 利用 率 ， 仓 库 利 用 率 是 仓库 可 利用 的 面积 或 容积 与 仓库 可 使 用 的 面积 或 容积 的 比率 ， 计 算 公式 为 : 
仓库 面积 利用 率 = 仓 库 实 际 使 用 面积 /仓库 可 用 面积 
仓库 容积 利用 率 = 仓 库 实 际 使 用 容积 /仓库 可 用 容积 


在 使 用 过 程 中 ， 部 分 企业 将 “建筑 面积 ”与 “可 用 面积 ”混淆 。 建 筑 面积 是 仓库 长 和 宽 的 乘积 ， 指 的 是 包括 所 有 材料 和 物体 在 内 的 总 面积 ; 而 可 用 面积 是 在 建筑 面积 的 基础 上 去 掉 围 墙 、 立 柱 、 走 廊 等 
不 可 使 用 的 部 分 。 仓 库容 积 计算 量 的 原理 类 似 ， 实 际 上 在 业务 中 很 难 达到 100% 的 使 用 率 。 


4. 仓储 物流 指标 
仓储 物流 指标 是 针对 物流 业务 节点 的 指标 ， 包 括 配送 业务 量 、 满 载 率 、 空 载 率 、 配 送 满足 率 、 配 送 准确 率 、 配 送 及 时 率 、 货 运 车 辆 数 、 货 运 车 辆 载重 量 、 配 送 满意 度 等 
(1) 配送 业务 量 


配送 业务 量 是 指 企业 根据 用 户 的 订单 需求 ， 对 商品 进行 拣选 、 包 装 、 出 库 、 配 送 等 作业 ， 并 按时 送 达 指 定 地 点 的 货物 数量 ， 包 括 区 域 配送 和 同城 配送 。 


满载 率 用 来 衡量 每 次 物流 运输 车 辆 满载 情况 ， 是 合理 安排 运力 的 重要 依据 之 一 ， 计 算 公式 为 : 

满载 率 = 车 辆 实际 载重 量 /车 辆 额定 载重 量 

在 不 超载 的 情况 下 ， 车 辆 的 满载 率 应 在 0~ 1 之 间 。 越 接近 于 1， 车 辆 利用 率 越 高 。 

(3) 空 载 率 

与 满载 率 相对 的 另 一 个 指标 是 空 载 率 ， 指 的 是 完全 空 车 行驶 的 车 辆 数量 占 整 体 车 辆 的 比例 ， 计 算 公式 为 : 

空 载 率 = 空 车 行驶 的 数量 /整体 车 辆 的 数量 

空 载 常 发 生 在 车 辆 将 货物 到 达 之 后 返回 始 发 地 的 过 程 中 。 如 果 不 合理 规划 用 车 ， 在 车 辆 返回 途中 将 面临 空 车 行驶 的 状态 ， 空 载 率 是 运力 安排 的 重要 评估 指标。 
(4) 配送 满足 率 

配送 满足 率 指 实际 可 用 配送 资源 与 配送 需求 的 比例 ， 计 算 公式 为 : 

配送 满足 率 = 实际 可 配送 订单 量 / 需 求 配送 订单 量 

在 正常 情况 下 ， 企 业 配送 资源 可 满足 订单 配送 需求 ; 只 在 特殊 情况 如 大 型 促销 活动 时 ， 可 能 由 于 订单 激增 而 产生 无 法 配送 的 订单 。 
(5) 配送 准确 率 

配送 准确 率 指 准确 配送 订单 的 比例 ， 计 算 公式 为 : 

配送 准确 率 = 准 确 配 送 的 订单 量 /总 配送 订单 量 

(6) 配送 及 时 率 


配送 及 时 率 指 的 是 企业 在 一 定时 间 内 完成 配送 的 比例 。 配 送 及 时 率 带 见于 对 物流 配送 有 严格 要 求 的 企业 ， 如 京东 的 211 物 流 计 划 是 上 午 11: 00 前 下 单 ， 当 日 送 达 ; 晚上 11: 00 前 下 单 ，; 
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(7) 货运 车 辆 数 


货运 车 辆 数 指 企业 可 以 使 用 的 货运 车 辆 的 总 数量 ， 可 分 为 自 有 货运 车 辆 和 租用 货运 车 辆 。 货 运 车 辆 不 只 包含 陆运 车 辆 ， 还 可 包含 水 上 运输 工具 、 铁 路 专线 、 航 空 飞机 等 。 


(8) 货运 车 辆 载重 量 
货运 车 辆 载重 量 指 所 有 可 用 车 辆 的 核定 载重 量 的 总 和 。 
(9) 配送 满意 度 


配送 满意 度 指 物流 配送 环节 用 户 满意 程度 ， 它 是 满意 的 配送 订单 所 占 总 配送 订单 的 比例 。 


7.2 成 本 控制 流 指标 


成 本 控制 是 业务 运营 的 重要 环节 ， 包 括 总 成 本 、 流 量 类 成 本 、 销 售 类 成 本 、 会 员 类 成 本 、 促 销 类 成 本 、 物 流 仓储 类 成 本 和 呼叫 中 心 类 成 本 等 。 


(1) 总 成 本 
总 成 本 指 所 有 业务 需要 的 总 成 本 以 及 汇总 所 有 业务 部 门 之 后 的 企业 总 成 本 。 
(2) 成 本 占 比 
成 本 占 比 指 各 业务 环节 的 成 本 或 企业 总 成 本 在 企业 成 区 总 额 中 的 占 比 ， 常 用 来 评估 各 业务 模块 的 费用 分 配 情况 。 计 算 公式 为 : 


成 本 占 比 = 相应 业务 (或 企业 整体 成 本 ) /企业 成 交 总 额 


流量 类 成 本 是 流量 相关 部 门 的 成 本 考核 标准 ， 包 括 CPM、CPD、CPC、CPA、 每 UV 成 本 、 每 访问 成 本 。 企 业 流量 类 成 本 是 企业 成 本 支出 的 重要 环节 之 一 。 

(1) CPM 

CPM (Cost Per Mille, 每 干 人 成 本 ) 是 广告 典型 的 付费 方式 之 一 ， 按 照 每 干 次 展现 付费 。 如 一 个 广告 展现 了 10000 次 ， 约 定 CPM 为 30 元 ， 那 么 对 于 该 广告 应 该 付费 300 元 。 
(2) CPD 


CPD (Cost Per Day， 按 天 展示 成 本 ) 是 传统 广告 媒介 尤其 是 门户 广告 普遍 采用 的 费用 结算 方式 ， 其 只 根据 展示 的 天 数 付费 ， 对 于 期 间 任何 广告 效果 (如 展示 、 点 击 、 目 标 转 化 等 ) 不 作 任何 承诺 。 与 
CPD 类 似 的 还 有 按 周 、 月 、 季 度 付费 购买 ， 付 费 逻 辑 相 同 ， 都 是 根据 固定 时 间 和 周期 付费 。 


(3) CPC 

CPC (Cost Per Click， 每 次 点 击 成 本 ) 广告 是 部 分 展示 类 广告 、SEM 广告 的 主流 投放 形式 ,企业 只 需要 按照 点 击 的 次 数 付费 。 

(4) CPA 

CPA (Cost Per Action， 每 次 行动 付费 ) 通常 会 将 行动 定义 为 网 站 特定 的 转化 目标 ， 如 下 载 、 试 用 、 填 写 表单 、 观 看 视频 等 ， 然 后 按照 转化 目标 的 数量 付费 。 

(5) 每 UV 成 本 

每 UV 成 本 指点 击 站 外 广告 到 达 网 站 后 ， 每 个 UV 的 成 本 。UV 成 本 较为 真实 地 反映 了 到 底 有 多 少 “ 人 ”到 达 网 站 ， 因 此 是 广告 类 部 门 的 重点 评估 指标 之 一 。 计 算 公式 为 : 
每 UV 成 本 = 广告 费用 /UV 

(6) 每 访问 成 本 

每 访问 成 本 指点 击 站 外 广告 到 达 网 站 后 ， 每 个 访问 的 成 本 。 相 对 于 每 UV 成 本 ， 每 访问 成 本 中 增加 了 “频次 ”的 考核 ， 也 是 广告 类 部 门 的 重点 评估 指标 之 一 。 计 算 公 式 为 : 
每 访问 成 本 = 广告 费用 /访问 量 

3. 销 售 类 成 本 

销售 类 成 本 是 所 有 销售 相关 部 门 都 涉及 的 考核 指标 ， 包 括 每 订单 成 本 、 每 有 效 订单 成 本 。 

(1) 每 订单 成 本 

每 订单 成 本 指 完成 每 个 订单 所 需要 的 成 本 。 计 算 公式 为 : 

每 订单 成 本 = 费用 /订单 量 


对 于 公式 中 的 费用 ， 不 同 部 门 有 不 同 的 费用 支出 情况 。 比 如 针对 广告 部 门 的 费用 通常 只 包含 广告 费用 ， 即 每 订单 成 本 = 广告 费用 /订单 量 ; 对 于 运营 类 部 门 的 费用 可 能 只 包含 促销 类 费用 ， 如 优惠 券 费 
用 。 广 告 部 门 中 存在 一 种 按 订 单 付费 的 合作 方式 一 一 CPS， 这 种 方式 基于 成 交 订单 而 支付 给 推广 媒介 一 定 比例 的 返点 。 它 也 属于 订单 成 本 的 一 种 。 


每 订单 成 本 核算 的 是 每 个 “ 毛 ” 订 单 成 本 ,订单 中 包含 了 所 有 状态 (包含 无 效 状态 ) ， 只 适合 评估 部 门 级 别 业务 效果 或 作为 企业 的 初级 评估 指标 。 
(2) 每 有 效 订 单 成 本 

每 有 效 订单 成 本 与 每 订单 成 本 计算 逻辑 相似 ， 不 同 点 在 于 该 指标 只 计算 所 有 订单 中 有 效 订单 的 部 分 。 计 算 公 式 为 : 

每 有 效 订单 成 本 = 费用 /有 效 订单 量 


该 指标 中 仅 包 含有 效 订单 状态 的 订单 成 本 ， 是 针对 企业 的 真实 评 佑 指标。 


会 员 类 成 本 用 于 评估 会 员 获 取 、 引 入 、 形 成 和 挽回 的 相关 部 门 的 业务 效果 ， 包 括 营 销 类 部 门 和 会 员 类 部 门 。 会 员 类 成 本 包括 每 注册 会 员 成 本 、 每 订单 会 员 成 本 、 每 订单 新 会 员 成 本 、 每 订单 老 会 员 成 


本 、 每 流失 会 员 挽回 成 本 。 
(1) 每 注册 会 员 成 本 
每 注册 会 员 成 本 指 带 来 一 个 新 注册 用 户 所 需 的 成 本 ， 计 算 公式 为 : 
每 注册 会 员 成 本 = 费用 /注册 会 员 数 
(2) 每 订单 会 员 成 本 
每 订单 会 员 成 本 指 带 来 每 个 订单 会 员 所 需 的 成 本 ,计算 公式 为 : 
每 订单 会 员 成 本 = 费用 /订单 会 员 数 
(3) 每 订单 新 会 员 成 本 
每 订单 新 会 员 成 本 指 带 来 每 个 订单 新 会 员 的 成 本 。 订 单 新 会 员 数 反映 了 企业 获取 新 会 员 的 能 力 和 水 平 ， 是 会 员 成 本 评估 的 重要 指标 之 一 。 计 算 公式 为 : 
每 订单 新 会 员 成 本 = 费用 /订单 新 会 员 数 
(4) 每 订单 老 会 员 成 本 
每 订单 老 会 员 成 本 指 带 来 每 个 订单 老 会 员 的 成 本 。 通 常情 况 下 ， 带 来 一 个 订单 老 会 员 的 成 本 要 大 大 低 于 新 会 员 的 成 本 ， 订 单 老 会 员 是 企业 价值 的 主要 贡献 者 。 计 算 公式 为 : 
每 订单 老 会 员 成 本 = 费用 /订单 老 会 员 
(5) 每 流失 会 员 挽 回 成 本 
针对 企业 流失 会 员 通 常 都 有 相应 的 业务 动作 ， 如 发 送 邮件 或 短信 甚至 是 接 通 呼叫 中 心 业务 等 ， 以 此 来 挽回 流失 的 会 员 。 每 流失 会 员 挽回 成 本 指 挽 回 每 个 流失 会 员 所 需要 的 成 本 。 计 算 公式 为 : 
每 流失 会 员 挽回 成 本 = 费用 /挽回 流失 会 员 数 
5. 促 销 类 成 本 
促销 类 成 本 主要 用 于 企业 促销 所 人 花费 的 内 部 成 本 ， 该 成 本 区 别 于 站 外 广告 投放 、 会 员 维 护 等 ， 属 于 企业 内 部 变相 折算 成 本 ， 包 括 优 惠 券 费用 、 积 分 兄 换 费用 、 限 价 、 现 价 、 促 销 价 等 。 
(1) 优惠 券 费用 
优惠 券 是 企业 促销 时 常用 的 方法 ， 优 惠 券 根 据 不 同 的 使 用 条 件 和 人 金额 可 以 分 成 多 种 类 型 ， 如 30 元 红 券 、50 元 店铺 券 等 ， 企 业 促销 时 申请 的 总 优惠 券 费用 是 企业 促销 费用 的 重要 组 成 部 分 。 
(2) 积分 史 换 费用 


几乎 所 有 网 站 都 有 会 员 积分 系统 ， 会 员 积分 通常 可 以 兑换 成 金额 使 用 。 如 网 站 的 积分 兑换 比例 为 20: 1， 即 每 20 个 积分 可 以 兑换 1 元 钱 。 在 促销 活动 中 ， 除 了 前 期 投入 的 广告 费用 、 促 销 优惠 券 费用 外 ， 
还 会 包含 两 种 情况 的 积分 费用 : 一 种 是 积分 可 以 直接 多 换 成 人 民 币 来 支付 订单 ， 另 一 种 是 订单 生成 后 会 赠送 一 定数 量 的 积分 再 次 形成 可 供 儿 换 的 金额 (对 企业 来 说 是 费用 ) 。 这 两 种 情况 的 积分 名 换 都 构成 
促销 时 的 费用 。 


限 价 是 企业 内 部 规定 的 商品 销售 时 的 最 低 售 价 ， 通 常 限 价 不 等 于 进货 价 ， 而 是 在 进货 价 的 基础 上 加 成 得 出 。 如 商品 进货 价 可 能 是 100 元 ， 按 照 5 个 点 加 成 得 出 限 价 是 105 元 (100+100x5%) 。 
现价 通常 是 企业 正常 的 销售 价格 ， 一 般 是 标 在 产品 展示 页 面 的 售 价 。 

(5) 促销 价 

促销 价 又 称 折 扣 价 ， 指 促销 时 的 商品 售 价 。 

6. 物 流 仓储 类 成 本 


流 仓储 类 成 本 是 企业 人 仓储、 物流、 配送 等 产生 的 费用 类 指标 ， 具 体 包括 进货 成 本 、 仓 储 成 本 、 装 提成 本 、 包 装 成 本 、 配 送 成 本 、 保 险 成 本 、 利 息 成 本 、 损 坏 成 本 、 附 件 成 本 和 其 他 成 本 ， 物 流 仓储 成 
本 是 企业 最 主要 的 成 本 支出 之 一 。 


(1) 进货 成 本 

进货 成 本 指 企业 商品 进货 时 发 生 的 商品 成 本 ， 用 相应 批 次 的 商品 进 价 乘 以 数量 的 值 相 加 后 得 出 。 

(2) 仓储 成 本 

仓储 成 本 指 企业 为 完成 货物 储存 业务 而 产生 的 成 本 ， 如 仓储 租赁 费用 、 运 维 管理 费用 等 。 

(3) 装卸 成 本 

装卸 成 本 指 企业 为 完成 商品 装卸 和 搬运 业务 而 产生 的 成 本 ， 包 括 临 时 业务 人 员 的 工资 、 装 卸 搬 运 设施 使 用 费用 和 业务 费用 等 。 
(4) 包装 成 本 

包装 成 本 指 企业 为 完成 商品 包装 而 产生 的 成 本 ， 包 括 包装 材料 、 包 装 设备 和 业务 费用 等 。 

(5) 配送 成 本 

配送 成 本 指 企业 为 完成 商品 配送 而 产生 的 成 本 ， 包 括 企业 自 有 配送 设施 和 车 辆 所 需要 的 使 用 费用 、 燃 料 消耗 、 保 养 等 费用 以 及 支付 第 三 方 物 流 配 送 的 费用 。 
(6) 保险 成 本 


保险 成 本 指 企业 在 采购 、 存 储 、 销 售 、 物 流 过 程 中 ， 为 预防 和 减少 商品 丢失 、 损 坏 等 情况 ， 与 社会 保险 部 门 或 保险 企业 共同 承担 风险 并 支付 的 商品 财产 保险 费用 。 


(7) 利息 成 本 

利息 成 本 指 企业 在 采购 、 销 售 商品 的 过 程 中 ， 由 于 资金 的 占用 而 需 承 担 的 利息 支出 。 

(8) 损坏 成 本 

损坏 成 本 指 企业 在 采购 、 销 售 商品 的 过 程 中 ， 因 物品 损耗 ， 包 括 破损 维修 与 完全 损毁 而 发 生 的 价值 丧失 。 

(9) 附件 成 本 

附件 成 本 指 企业 在 运送 商品 的 过 程 中 ， 支 付 给 运输 管理 或 投资 部 门 的 各 种 交通 建设 基金 、 过 路 费 、 过 桥 费 、 过 闻 费 等 。 
(10) 其 他 成 本 

除 以 上 成 本 外 ， 物 流 仓储 类 费用 还 包括 相关 业务 设施 年 折旧 、 燃 料 与 动力 消耗 、 设 施 与 设备 维修 保养 费 和 业务 费 。 
7. 呼 叫 中 心 类 成 本 

呼叫 中 心 类 成 本 包括 平均 单 呼 成 本 和 平均 成 功 呼出 成 本 。 

(1) 平均 单 呼 成 本 

平均 单 呼 成 本 指 呼叫 中 心 处 理 每 个 电话 所 需 费 用 。 计 算 公式 为 : 

平均 单 呼 成 本 = 呼叫 中 心 的 全 部 费用 /电话 处 理 量 

(2) 平均 成 功 呼 出 成 本 

平均 成 功 呼 出 成 本 指 呼叫 中 心 成 功 呼出 每 个 电话 所 需 费 用 。 计 算 公 式 为 : 


平均 成 功 呼 出 成 本 = 呼叫 中 心 的 全 部 费用 /成 功 呼 出 电话 量 


7.3 ”收益 控制 法 指标 


收益 、 销 售 类 收益 


包括 两 部 分 : 一 部 分 是 企业 最 终 获 得 的 成 交 销 售 额 以 及 相应 的 利润 ; 另 一 部 分 是 过 程 中 定义 的 目标 收益 ， 即 完成 每 个 目标 会 带 来 的 预期 价值 。 收 益 控制 流 指标 包括 总 收益 、 流 


网 站 收益 的 定义 通常 
益 、 会 员 类 收益 、 促 销 类 收益 、 物 流 仓储 类 收益 、 呼 叫 中 心 类 收益 。 


、 
AN 


成 交 总 额 指 所 有 包含 企业 自 营业 务 中 的 订单 总 金额 以 及 平台 业务 中 的 成 交 总 额 。 


成 交 总 额 占 比 通常 用 来 评估 不 同 部 门 的 成 交 贡 献 比 例 ， 如 不 同 的 产品 线 、 不 同 的 服务 模块 等 。 通 常情 况 下 ， 业 务 成 交 总 额 占 比 越 大 ， 说 明 该 部 门 对 企业 贡献 越 大 。 计 算 公 式 为 : 

成 交 总 额 占 比 = 相应 业务 的 成 交 总 额 /成 交 总 额 

全 尘 癌 成 交 总 额 规模 和 占 比 是 评价 业务 重要 性 的 重要 标准 ， 但 不 是 唯一 标准 。 通 常 需 要 结合 企业 目前 的 战略 侧重 点 、 盈 利 模 式 等 进行 综合 评估 ， 平 台 型 企业 更 注重 成 交 总 额 。 
(3) 总 利润 

总 利润 指 企业 获 得 的 所 有 利润 ， 通 常 业 务 体系 中 的 利润 包括 自 营业 务 中 的 进 销 差价 利润 以 及 平台 业务 中 的 佣金 利润 两 部 分 ， 其 中 不 含 促销 费用 、 摊 销 成 本 、 广 告 费用 等 其 他 费用 ， 属 于 企业 毛利 润 
(4) 利润 占 比 

利润 占 比 是 各 业务 模块 占 整体 利润 的 比例 ， 计 算 公 式 为 : 

利润 占 比 = 业务 模块 利润 /总 利润 
(5) 利润 率 

利润 率 指 利润 占 成 交 额 的 比例 ， 是 评估 不 同业 务 盔 利 能 力 的 重要 参考 指标 ， 成 交 总 额 和 利润 率 共同 决定 利润 规模 。 计 算 公 式 为 : 

利润 率 = 利润 /成 交 额 
(6) ROI 

ROI 即 投资 回报 率 ， 指 投入 费用 所 能 带 来 的 收益 比例 ， 计 算 公 式 为 : 


ROI= 利 润 / 费 用 


ROI= 成 交 金 额 / 费 用 


在 大 多 数 电 商 企业 中 ，ROI 计 算 都 使 用 第 二 个 公式 ， 原 因 是 电 商 企业 的 利润 大 多 为 负数 ， 因 此 ROI 更 多 评估 的 是 每 单位 费用 带 来 的 销售 额 。 


流量 类 收益 是 流量 相关 部 门 的 收益 考核 标准 ， 包 括 每 次 点 击 收益 、 每 UV 收益 、 每 访问 收益 、 每 个 目标 转化 收益 。 


旦 米 
量 类 


oo 


(1) 每 次 点 击 收益 
每 次 点 击 收益 指 每 次 站 外 广告 点 击 能 获得 的 转化 收益 ， 通 常 将 转化 定义 为 电子 商务 交易 收入 ， 即 订单 金额 。 
(2) 每 UV 收益 


每 UV 收益 指点 击 站 外 广告 到 达 网 站 后 ， 每 个 UV 产生 的 转化 收益 。UV 收 益 反 映 了 每 个 人 能 带 来 多 少 订单 收益 ， 计 算 公 式 为 : 


(3) 每 访问 收益 

每 访问 收益 指点 击 站 外 广告 到 达 网 站 后 ， 每 个 访问 产生 的 转化 收益 。 相 对 于 每 UV 收益 ， 每 访问 收益 中 增加 了 “频次 ”的 考核 ， 反 应 的 是 每 人 次 收益 结果 。 计 算 公式 为 : 
每 访问 收益 = 广告 总 收益 /访问 量 

(4) 每 个 目标 转化 收益 

对 网 站 内 的 每 个 目标 ， 通 常会 定义 一 个 目标 转化 值 。 如 根据 业务 经 验 ， 每 一 次 下 载 会 产生 50 元 最 终 转 化 收入 ， 那 么 可 以 将 目标 转化 收益 设 定 为 50 元 。 
目标 转化 收益 可 以 作为 所 有 非 电 子 商务 类 网 站 的 收益 评估 目标 ， 除 此 之 外 的 所 有 收益 都 使 用 电子 商务 转化 收益 

3. 销 售 类 收益 

销售 类 收益 包括 每 订单 收益 、 每 有 效 订 单 收益 。 两 个 指标 都 用 来 评估 每 个 订单 可 以 带 来 的 收益 价值 ， 区 别 在 于 后 者 只 评估 真实 订单 收益 。 

(1) 每 订单 收益 

每 订单 收益 指 完成 每 个 订单 带 来 的 收益 。 计 算 公式 为 : 

每 订单 收益 = 订单 成 交 金 额 /订单 量 

每 订单 收益 核算 的 是 每 个 “ 毛 ” 订 单 收 益 ， 订 单 中 包含 了 所 有 状态 (包含 无 效 状 态 ) 的 订单 ， 适 合 于 部 门 级 别 或 企业 初级 评估 指标 。 

(2) 每 有 效 订 单 收益 

每 有 效 订 单 收益 与 每 订单 收益 的 计算 逻辑 相似 ， 不 同 点 在 于 该 指标 只 计算 所 有 订单 中 有 效 订单 的 部 分 。 计 算 公式 为 : 

每 有 效 订单 收益 = 有 效 订 单 成 交 金 额 /有 效 订单 量 


该 指标 中 仪 包含 有 效 订单 状态 的 订单 收益 ， 是 针对 企业 级 别 的 真实 评 佑 指标。 


会 员 类 收益 用 于 评估 站 外 有 会 员 获取 、 引 入 、 形 成 和 挽回 的 相关 部 门 ， 包 括 营销 类 部 门 和 会 员 类 部 门 。 会 员 类 收益 包括 每 订单 会 员 收 益 、 每 订单 新 会 员 收 益 、 每 订单 老 会 员 收益 。 


(1) 每 订单 会 员 收益 


(2) 每 订单 新 会 员 收益 
每 订单 新 会 员 收 益 指 每 个 订单 新 会 员 带 来 的 收益 。 计 算 公 式 为 : 
每 订单 新 会 员 收益 = 新 会 员 订 单 成 交 金 额 /订单 新 会 员 数 

(3) 每 订单 老 会 员 收益 
每 订单 老 会 员 收 益 指 每 个 订单 者 会 员 带 来 的 收益 。 计 算 公式 为 : 


每 订单 老 会 员 收益 = 老 会 员 订 单 成 交 金 额 /订单 老 会 员 数 


25. 促销 类 收益 
促销 类 收益 主要 用 于 企业 促销 所 产生 的 收益 情况 ， 包 括 每 优惠 券 收益 、 每 积分 兄 换 收益 、 活 动 直接 收入 、 活 动 间接 收入 、 活 动 收入 贡献 和 活动 拉 升 比例 。 


(1) 每 优惠 券 收益 
每 优惠 券 收 益 指 每 张 优 惠 券 能 带 来 的 收益 。 计 算 公式 为 : 
每 优惠 券 收益 = 优惠 券 带 来 的 订单 成 交 金 额 /优惠 券 数量 
由 于 企业 往往 发 送 不 同 的 优惠 券 面 值 ， 需要 在 此 基础 上 分 别 计算 每 种 优惠 券 带 来 的 收益 水 平 。 
(2) 每 积分 兄 换 收 益 
积分 与 优惠 券 类 似 ， 都 是 用 来 衡量 优惠 促销 对 销售 的 拉动 情况 。 计 算 公式 为 : 
每 积分 沈 换 收益 = 使 用 积分 沈 换 的 订单 成 交 金额 /积分 兑换 量 
合 尘 总 在 实际 业务 中 ， 由 于 用 户 往往 可 以 在 同一 个 订单 中 同时 使 用 积分 和 优惠 券 ， 因 此 可 能 会 出 现 订 单 贡献 重复 计算 的 情 
(3) 活动 直接 收入 


活动 直接 收入 指 单纯 通过 促销 活动 带 来 的 收入 ， 用 户 购买 的 订单 均 属 于 促销 活动 商品 。 


(4) 活动 间接 收入 


活动 间接 收入 指 通过 促销 活动 带 来 的 用 户 购 买 了 非 活动 商品 的 收入 情况 。 通 常 计算 活动 间接 收入 的 逻辑 是 该 用 户 通过 促销 活动 引入 且 订 单 属于 非 活动 商品 ， 通 过 促销 活动 引入 可 通过 定义 用 户 落 地 页 是 
否 为 活动 页 面 加 以 区 分 ， 订 单 属 于 非 活动 商品 可 通过 参与 活动 商品 列表 进行 拆 分 。 


(5) 活动 收入 贡献 

活动 收入 贡献 包含 活动 直接 收入 贡献 和 活动 间接 收入 贡献 的 总 金额 ， 用 活动 收入 贡献 总 金额 除 以 全 站 订单 成 交 金 额 得 出 活动 收入 贡献 占 比 ， 计 算 公式 为 : 
活动 收入 贡献 占 比 = (活动 直接 收入 + 活动 间接 收入 ) /全 站 订单 成 交 金 额 

当然 ， 除 了 可 以 用 订单 成 交 金 额 计算 外 ， 还 可 以 使 用 订单 量 、 商 品 销售 量 等 计算 活动 贡献 情况 ， 计 算 逻 辑 相同 。 

(6) 活动 拉 升 比例 

活动 拉 升 比例 反映 活动 对 全 站 销售 的 拉 升 情况 ， 可 以 指 销量 拉 升 、 销 售 额 拉 升 、 订 单 量 拉 升 等 。 


活动 拉 升 比例 通常 不 能 使 用 活动 贡献 占 比 来 评估 ， 原 因 是 活动 促销 期 间 本 来 应 该 通过 正常 流程 和 渠道 购物 的 用 户 反 而 会 通过 促销 渠道 下 单 。 最 简单 的 计算 方法 是 用 活动 期 间 的 收入 与 非 活动 期 间 的 收入 
进行 对 比 。 计 算 公式 为 : 


活动 拉 升 比例 = (活动 期 间 收 入 / 非 活 动 期 间 收 入 ) -1 
辐 注 意 在 通常 情况 下 ， 在 计算 活动 拉 升 比例 会 发 现 收入 拉 升 效果 不 如 订单 量 和 销量 明显 ， 原 因 是 通常 促销 客 单价 较 低 ， 影 响 收入 提升 效果 。 
6. 物 流 仓储 类 收益 


流 仓 储 类 收益 包括 企业 通过 仓储 、 物 流 、 配 送 等 产生 的 收益 类 指标 ， 主 要 收益 集中 表现 在 每 配送 单 促 生 的 收益 ， 除 此 之 外 部 分 企业 提供 的 平台 性 业务 也 会 产生 收益 ， 如 为 第 三 方 提供 仓储 、 装 卸 、 包 
装 、 配 送 等 服务 产生 的 收益 。 


(1) 仓储 收益 

仓储 收益 指 企业 为 第 三 方 提供 仓储 租赁 收益 、 运 维 管理 等 产生 的 收益 。 

(2) 装卸 收益 

装卸 收益 指 企业 为 第 三 方 提供 装卸 和 搬运 业务 所 产生 的 收益 。 

(3) 包装 收益 

包装 收益 指 企业 为 第 三 方 提供 包装 业务 所 产生 的 收益 。 

(4) 每 配送 单 收 益 

每 配送 单 收益 指 企 业 完 成 商品 配送 业务 而 产生 的 收益 ， 其 中 包含 完成 配送 后 从 顾客 获取 的 收益 以 及 为 第 三 方 提 供 配 送 服务 产生 的 收益 。 
7. 呼 叫 中 心 类 收益 

呼叫 中 心 类 收益 通常 指 呼 叫 中 心 具有 明确 销售 业务 时 产生 的 收益 ,包括 订购 、 升 级 、 使 用 等 付费 业务 ， 指 标 包括 平均 单 呼 收益 和 平均 成 功 呼出 收益 。 
(1) 平均 单 呼 收益 

平均 单 呼 收益 指 呼叫 中 心 每 个 电话 所 产生 的 收益 ， 包 含 通过 呼 入 业务 产生 的 收益 和 呼出 业务 产生 的 收益 。 计 算 公式 为 : 

平均 单 呼 收益 = 呼叫 中 心 的 全 部 收益 /电话 处 理 量 

(2) 平均 成 功 呼出 收益 

平均 成 功 呼出 收益 指 呼 叫 中 心 成 功 呼出 每 个 电话 所 产生 的 收益 ， 计 算 公式 为 : 


平均 成 功 呼 出 收益 = 呼叫 中 心 的 全 部 收益 /成 功 呼出 电话 量 
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本 章 重 点 介绍 了 围绕 企业 各 环节 的 数据 指标 ， 涵 盖 了 从 站 外 流量 引入 到 订单 闭环 完成 的 整个 流程 。 在 实际 应 用 过 程 中 ， 读 者 可 根据 自身 部 门 的 架构 和 负责 范围 选择 应 用 指标 。 
对 于 所 有 业务 的 评估 指标 ， 企 业 层 面 重点 关注 投入 和 产 出 ， 即 花费 多 少 钱 ， 带 来 多 少 收益 ;而 从 业务 层面 重点 关注 实际 业务 效果 ， 这 是 针对 不 同 数据 汇报 对 象 的 典型 应 用 差异 。 
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本 章 中 的 指标 基本 为 结果 类 指标 ， 即 指标 用 来 做 效果 评估 使 用 ;除了 效果 评估 外 ， 企 业 应 用 中 还 会 包括 过 程 类 指标 ， 这 些 过 程 类 指标 在 不 同 的 公司 、 不 同 的 业务 及 不 同 的 场景 下 有 所 差异 ，i 
者 根据 自身 的 实际 情况 进行 拓展 。 


另外 ， 建 议 读者 在 搭建 数据 指标 体系 时 ， 首 先 建立 对 整个 业务 体系 的 理解 ， 然 后 再 针对 企业 整体 流程 建立 完善 的 数据 分 析 体 系 和 评估 指标 ， 这 样 才能 做 到 立足 于 全 局 并 着 眼 于 局 部 。 


第 8 草 ”数据 分 析 场 景 和 方法 


在 企业 应 用 实践 中 ， 数 据 发 挥 价值 的 场景 可 分 为 四 类 : 以 效果 预测 为 目的 的 数据 分 析 、 以 结论 定义 为 目的 的 数据 分 析 、 以 数据 探究 为 目的 的 数据 分 析 和 以 业务 执行 为 目的 的 数据 分 析 。 这 四 类 场景 贯穿 
于 每 个 业务 活动 的 始末 ， 使 得 数据 工作 与 业务 动作 成 为 一 个 完整 、 密 不 可 分 的 有 机 体 。 


本 章 从 这 四 类 数据 应 用 场景 入 手 ， 分 别 介绍 每 类 场景 的 含义 、 应 用 方向 和 数据 分 析 及 挖掘 方法 ， 同 时 介绍 特定 分 析 场 景 中 的 应 用 误区 ; 最 后 会 引申 出 数据 工具 、 模 型 与 算法 选择 的 三 个 原则 ， 虽 在 帮助 
读者 建立 正确 的 数据 技术 观念 。 


8.1 ”以 效果 预 则 为 目的 的 数据 分 析 


8.1.1 效果 预测 是 什么 


效果 预测 是 对 未 来 的 预 估 和 推断 ， 常 被 应 用 在 业务 执行 前 的 计划 和 评估 阶段 。 效 果 预 测 可 以 帮助 业务 建立 合理 的 预期 目标 ， 并 为 实现 目标 建立 资源 需求 图 谱 ; 同时 预测 还 能 够 帮助 企业 提前 识别 未 来 会 
发 生 的 异常 情况 ， 通 过 建立 相关 机 制 减少 或 避免 损失 。 常 见 的 效果 预测 场景 如 下 : 


未 来 一 个 月 内 ， 商 品 价格 会 下 降 20%。 
: 本 次 促销 活动 预计 响应 率 会 达到 80%， 带 来 300 万 元 订单 收入 。 
. 预计 下 周 会 员 活跃 度 会 从 一 般 活 跃 上 升 到 非常 活跃 。 


“ 预期 下 个 月 网 站 日 均 流量 为 300~500 之 间 。 
8.1.2 ”效果 预测 的 两 种 类 型 
预测 结果 大 多 是 具体 值 ， 如 20%、800 万 元 、200 万 元 等 。 另 外 ， 还 可 能 是 特定 区 间或 分 类 ， 如 高 级 活跃 会 员 、A 类 销售 店铺 、 响 应 或 不 响应 等 。 


1. 预 测 结果 为 具体 值 


当 预 测 结果 是 具体 值 时 可 以 更 有 效 的 协助 业务 评估 预期 效果 。 图 8-1 所 示 为 未 来 10 个 月 的 销售 预测 结果 ， 该 结果 直接 以 数字 的 形式 展现 并 通过 图 形 反映 出 变化 趋势 。 
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图 8-1 未 来 10 个 月 的 销售 预测 结果 
2. 预 测 结 果 为 一 个 区 间 


当 预 测 结果 是 一 个 特定 分 类 或 区 间 时 可 以 为 业务 提供 分 类 结果 ， 通 常 是 业务 预定 义 的 具有 某 种 特定 意义 或 业务 特征 的 类 别 。 如 当 预 测 结果 为 A 类 会 员 时 ， 可 能 意味 着 该 类 会 员 的 价值 较 高 ， 当 预测 结果 
为 A 类 店铺 时 ， 意 味 着 其 销售 额 处 在 某 个 特定 区 间 如 100 万 ~300 万 元 之 间 。 


预测 结果 为 区 间 时 的 特例 是 结果 集 为 “是 (Y) ”和 “人 否 (N) ”,， 这 是 典型 的 目标 结果 值 ， 如 是 否 响应 活动 、 是 否 购买 商品 、 是 否 参与 试用 、 是 否 付费 等 。 图 8-2 所 示 为 预测 用 户 是 否 会 接受 新 服务 预 
订 ， 当 Accept News service Offering 为 No 时 代表 否 (不 接受 新 服务 预订 ) ， 当 为 Yes 时 代表 是 (接受 新 服务 预订 ) 。 “是 ”和 “人 否 ” 通 常会 转化 为 具有 “标识 ”特征 的 1 和 0， 以 便于 数据 运算 。 


8.1.3 ”效果 预测 的 应 用 场景 


效果 预测 包括 正 向 预测 和 负 向 了 预测 两 种 。 


Gender| age in Years| Hours Ty Per Day| Nurnber of Organizations | # Children| Resp. Income Cateogom| Accept News Service Offering 
20 Male 35 ] 0 1 $30-40K Yes 
14 Female 6 $40-50K YES 

9 Male 172 $20-30k YBS 
12 Fermale 67 各 用 U 
15 -Male 33 >To0k TES 
1 4 hale 2 了 $20-30k 装 I 
1 4 人 ae 50 40-50k 
9 hale i? nul 
14 Female 52 $30-40K 
16 Female 58 $20-30k 
13 ale 4 30-40k 
12 hiale 60 $10-20k 
13 Male 21 $10-20k 
11 Male Bd4 Eight or.. $40-50F 
18 Male 39 $30-40k 
16 hale 35 $30-40k 
11 Female ?1 $nulls 
14 Female 50 $20-30K 


轩 Wills | = 


人 一 Ch 


2 
2 
4 
2 
4 
1 

4 
2 
了 
1 

了 
2 
1 
5 
0 
3 
可 


一 | hh 它 | | 忆 一 | 亡 亡 亡 一 一 | 亡 亡 下 JJ 一 
Do -上 | | hh 


图 8-2 预测 用 户 是 否 会 接受 新 服务 预订 
1. 正 向 预测 场景 


正 同 效果 预测 通常 是 基于 已 知事 实 X 推 导 未 知事 实 Y， 即 从 前 到 后 的 正 向 预测 。 这 种 预测 应 用 的 前 提 是 可 控 因 素 和 变量 事实 X， 基 于 此 预测 会 达成 目标 。 正 向 效果 预测 常用 于 制定 KPI、 战 略 目标 、 战 术 目 
标 等 业务 场景 中 ， 如 : 


告 部 门 掌握 了 50 万 元 预算 ， 预 期 能 带 来 多 少 UV? 
. 公司 现 有 5000 万 名 会 员 ， 预 计 1 年 后 会 流失 多 少 会 员 ? 
: A 手 机 产品 现 售 价 4800 元 ， 预 计 3 个 月 后 多 少 ? 
. 未 来 一 月 内 的 订单 是 多 少 ? 
2. 负 向 预测 场景 
负 向 预测 场景 通常 是 基于 已 知事 实 或 目标 ， 即 Y 反 向 推导 过 程 事实 X， 属 于 从 后 向 前 的 预测 。 这 种 场景 应 用 的 前 提 是 已 经 掌握 目标 信息 ， 在 业务 规划 时 预测 达成 目标 所 需 的 资源 和 投入 情况 ， 如 : 
全 站 本 月 的 目标 UV 是 3000 万 元 ， 需 要 投入 多 少 广告 费用 ? 
. 明日 活动 的 目标 销售 额 是 5000 万 元 ， 预 计 需 要 多 少 促销 费用 ? 
. 未 来 7 天 内 的 订单 目标 是 400 万 元 ， 预 计 备 货 多 少 ? 
. 本 次 活动 的 预期 订单 人 数 是 20 万 人 ， 预 计 需 要 发 送 多 少 EDM? 
人 @@i 却 在 预测 类 应 用 中 ， 大 多 数 场景 下 都 有 确定 可 计算 的 变量 (由 已 知 X 计 算 未 知 了 或 由 已 知 ? 计 算 未 知 X) ; 部 分 情况 下 也 会 存在 没有 X， 即 没有 自 变量 ， 只 有 Y， 即 因 变 量 的 情况 ， 在 这 种 情况 下 通 


常 使 用 时 间作 为 又 的 延伸 变量 进行 计算 。 


8.1.4 ”预测 结果 的 常用 方法 


预测 结果 的 常用 方法 包括 定性 预测 、 时 间 序 列 、 因 果 联 系 和 特征 关系 四 类 。 
1. 定 性 预测 

定性 分 析 是 业务 结合 历史 经 验 进行 预测 的 一 种 方法 ， 包 括 同比 法 、 环 比 法 和 平均 数 法 。 
(1) 同比 法 


同比 是 与 历史 同期 (通常 是 年 ) 的 对 比 ， 同 比 可 以 消除 季节 、 短 期 时 间 波 动 等 因素 产生 的 影响 。 由 于 对 比 时 间 跨 度 长 ， 该 方法 适合 发 展 相对 稳定 的 企业 ， 表 现在 数据 结果 上 是 不 同年 份 间 相 同月 度数 据 
差异 波动 较 小 ;发 展 较 快 的 中 小 企业 或 大 型 企业 中 的 新 兴业 务 ， 则 不 适合 使 用 该 方法 。 


举例 : 表 8-1 是 基 企 业 2012 年 和 2013 年 订单 量 月 度 分 布 数 据 ， 通 过 表 中 的 数据 看 出 该 企业 2013 年 相对 2012 年 相同 月 份 的 订单 量 差异 较 小 ，1~ 5 月 订单 差异 量 分 别 为 5、21、19、13、9。 


表 8-1 某 企 业 2012 年 和 2013 年 订单 量 月 度 分 布 数据 
月 份 2012 年 2013 年 EE 2012 年 2013 年 
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现 要 推断 2013 年 6 月 订单 量 数据 ， 可 以 使 用 同比 法 实现 。 由 表 8-1 中 的 数据 可 知 ，2013 年 同比 2012 年 月 度 增长 率 计算 公式 为 : 
同比 增长 率 =2013 年 月 度 订单 量 /2012 月 度 订单 量 -1 


1~5 月 订单 量 增长 率 分 别 为 : 1%、2%、2%、2%、1%，6 月 份 增长 率 没有 特殊 情况 下 滑 预 计 是 在 1%~2% 之 间 ， 预 计 订单 量 为 421~426 之 间 。 


(2) 环比 法 


环比 是 指 与 上 一 个 统计 周期 进行 对 比 ， 如 果 统 计 周 期 为 月 度 ， 环 比 时 间 就 是 上 个 月 ; 如 果 统 计 周 期 为 周 度 ， 环 比 时 间 就 是 上 一 周 。 环 比 法 数据 周期 灵活 且 是 临近 周期 的 数据 对 比 ， 更 适合 作为 周 度 和 月 
度 计划 使 用 。 


环比 增长 率 的 计算 公式 为 : 

环比 增长 率 = 本 期 数据 /上 期 数据 -1 

举例 : 对 于 表 8-1 中 的 数据 ， 如 果 使 用 2012 年 5 月 数据 推算 2013 年 6 月 数据 ， 那 么 预测 结果 为 421。 
(3) 平均 数 法 


平均 数 是 一 组 数据 的 均值 ， 通 常 有 算术 平均 数 、 几 何平 均 数 、 调 和 平均 数 、 加 权 平 均 数 、 平 方 平均 数 、 指 数 平均 数 几 种 算法 ， 最 常 使 用 的 是 算术 平均 数 ， 即 一 组 数据 的 和 除 以 这 组 数据 的 个 数 所 得 的 
平均 数 法 适合 于 数据 较为 稳定 情况 下 的 预测 ， 预 测 结果 属于 中 间 水 平 ， 即 结果 不 会 落 于 过 高 或 过 低 的 水 平 ， 是 一 种 求 稳 的 预测 方法 。 以 表 8-1 数 据 举 例 ， 预 测 2013 年 6 月 数据 ， 使 用 平均 数 法 计算 结果 


2013 年 6 月 订单 量 = (750+900+880+0670+880) /5=816 
从 计算 结果 可 以 看 出 ， 平 均 数 法 极 易 受 极 大 值 和 极 小 值 的 影响 ， 且 无 法 结合 前 后 数据 关系 进行 递 推 ， 因 此 平均 数 用 作 预 测 的 场景 限制 较 大 。 
2. 时 间 序 列 
时 间 序 列 是 根据 时 间 进 行 预测 的 一 种 方法 ， 时 间 序 列 包括 指数 平滑 法 、 移 动 平 均 法 、ARIMA 等 预测 方法 。 
(1) 指数 平滑 法 
指数 平滑 法 是 通过 计算 指数 平滑 值 ， 配 合 一 定 的 时 间 序列 预测 模型 进行 预测， 其 原理 是 任 一 期 的 指数 平滑 值 都 是 本 期 实际 观察 值 与 前 一 期 指数 平滑 值 的 加 权 平 均 。 
指数 平滑 法 是 一 种 简单 的 预测 方法 ， 由 于 其 计算 逻辑 中 兼顾 所 有 数据 集 ， 同 时 能 自 定义 不 同时 期 的 数据 权重 ， 因 此 数据 结果 会 更 符合 未 来 的 发 展 趋势 。 
举例 : 表 8-2 是 某 企 业 月 度 订 单 量 分 布 ， 现 使 用 Excel 2013 自 带 的 指数 平滑 模型 预测 第 12 个 月 的 订单 量 。 


表 8-2 某 企 业 月 度 订单 量 分 布 


月 月 从 ”| 30 
T7435 


步骤 一 : 启用 “数据 分 析 功 能 ”， 在 Excel “文件 一 选项 一 加 载 项 ”中 选择 “分 析 工 具 库 ”， 单 击 底部 “ 跳 转 到 ”按钮 ， 在 弹出 的 “可 用 加 载 安 ” 中 选择 “分 析 工 具 库 ”。 
步骤 二 : 点 击 Excel 栅 部 中 的 “数据 ”菜单 ， 在 最 右 侧 会 新 增 “ 数 据 分 析 ” 功 能 ， 点 击 该 功能 。 
步骤 三 : 在 弹出 的 “数据 分 析 ” 窗 口中 选择 “指数 平滑 ”模型 ， 单 击 “ 确 定 ” 按 钮 ; 在 图 8-3 所 示 的 界面 中 ， 选 择 数据 输入 区 域 ， 设 置 阻尼 系统 和 输出 区 域 ， 单 击 “ 确 定 ”按钮 。 
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图 8-3 ”指数 平滑 设置 界面 


阻尼 系数 的 值 在 0~ 1 之 间 ， 初 期 可 能 无 法 确认 最 佳 系数 值 ， 可 分 别 输入 多 个 进行 测试 ， 测 试 完成 之 后 的 数据 拟 合 情 况 ， 如 图 8-4 所 示 。 当 阻尼 系数 为 0.2 时 ， 拟 合 曲线 最 接近 于 原始 数据 值 。 


指数 平 消 应 用 案例 


ee | 后 办 伯 。 ee 系数 0.2 em 系数 0.6 系数 0.8 


图 8-4 指数 平滑 应 用 案例 
由 Excle 直 接 得 到 12 月 份 的 数据 结果 为 : 12 月 份 订单 量 =0.8x11 月 原始 订单 量 +0.2x11 月 预测 订单 量 =0.8x1655+0.2x1571=1638。 


ia Excel 中 设置 的 系数 为 阻尼 系数 ， 阻 尼 系 数 与 平滑 指数 相对 ， 即 阻尼 系数 + 平滑 指数 =1。 阻 尼 系 统 取 值 为 0~1 之 间 ， 当 原始 数据 波动 不 大 时 ， 阻 尼 系 数 宜 设置 为 较 小 值 如 0.5 以 下 ; 当 原 始 数据 波 
动 较 大 时 ， 阻 尼 系 统 宜 设置 为 较 大 值 如 0.5 以 上 。 当 不 确定 如 何 设置 阻尼 系数 时 ， 可 多 次 设置 阻尼 系数 并 通过 色 选 “图 形 输出 ”和 “标准 误差 ”综合 评估 拟 合 程 度 。 


Excel 中 的 指数 平滑 是 最 简单 的 指数 平滑 模型 ， 除 此 之 外 ， 指 数 平滑 还 有 Holts 线 性 趋势 预测 、Browns 线 性 趋势 、 简 单 季节 性 模型 、Winters 加 法 、Winters 乘 法 预测 模型 等 不 同 模型 。 
(2) 移动 平均 法 


移动 平均 法 是 一 种 简单 平滑 预测 方法 ， 它 的 基本 思想 是 : 根据 时 间 序 列 数据 逐 项 推移 ， 依 次 计算 包含 一 定 项 数 ( 自 定 义 的 项 目 数量 ) 的 序 时 平均 值 ， 以 反映 长 期 趋势 的 方法 。 移 动 平均 法 与 指数 平滑 法 
的 重要 区 别 在 于 移动 平均 不 考虑 较 远 期 的 数据 ， 并 在 加 权 移 动 平均 法 中 给 予 近期 数据 更 大 的 权重 。 


移动 平均 法 的 应 用 场景 是 即时 预测 ， 即 预测 数据 发 生 当天 或 当时 的 情况 ， 如 活动 当天 的 即时 库存 、 即 时 销量 等 。 由 于 移动 平均 法 实质 上 是 使 用 一 定 区 间 的 平均 数 做 计算 ， 可 以 消除 周期 变动 和 随机 波动 
的 影响 ， 但 无 法 反映 数据 波动 并 对 波动 做 出 预测 。 


移动 平均 法 分 为 简单 移动 平均 和 加 权 移 动 平均 两 种 : 简单 移动 平均 是 将 区 间 内 的 数据 汇总 求 和 ; 加 权 移 动 平均 是 将 区 间 内 的 数据 先 乘 权重 后 再 相 加 得 出 ，Excel 提 供 了 简单 移动 平均 模型 。 


举例 : 使 用 Excel 2013 中 的 移动 平均 法 对 表 8-2 数 据 进 行 预测 。 移 动 平 均 的 应 用 场景 决定 了 当 12 月 没有 数据 时 无 法 进行 预测 ， 因 此 这 里 假设 在 12 月 25 日 ， 已 经 产生 了 1600 的 订单 量 ， 现 要 预测 整个 12 月 


份 一 共 能 产生 多 少 订单 。 
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图 表 凡 出 避 


图 8-5 “移动 平均 ”设置 界面 
移动 平均 应 用 的 前 期 步骤 与 指数 平滑 相同 ， 在 “数据 分 析 ” 模 块 中 选择 “移动 平均 ”， 分别 设 置 数 据 输入 和 输出 区 域 、 数 据 间 隔 等 ， 如 图 8-5 所 示 。 


在 进行 初期 设置 时 ， 间 隔 可 依次 测试 不 同 值 以 便 评估 拟 合 情 况 ， 图 8-6 所 示 为 分 别 使 用 2、4、 6 进行 测试 。 如 果 测 试 样本 多 ， 可 输入 更 大 的 测试 区 间 。 


移动 平均 应 用 案例 


间隔 6 项 ”ee 实际 什 ”一 一 | 日 卫 4 项 ”一 =—| 昌 [也 2 项 


图 8-6 ”移动 平均 应 用 案例 


从 图 8-6 中 观测 得 到 ， 当 区 间 为 2 时 更 符合 拟 合 预期 。 此 时 ， 预 测 订单 结果 为 1618 (该 结果 可 直接 通过 Excel 数 据 获得 ) 。 


ia 移动 平均 中 的 间隔 设置 越 大 对 突 发 性 数据 越 不 敏感 ， 间 隔 越 小 对 突 发 性 数据 越 敏 感 。 如 果 拟 合 数 据 中 包含 规律 性 、 季 节 性 时 间 ， 建 议 间 隔 设 置 与 变动 周期 一 致 。 比 如 ， 如 果 是 每 天 24 小 时 的 数 


据 ， 那 么 间隔 就 是 24; 如 果 是 按 天 展示 的 月 度数 据 ， 那 么 可 以 设置 间隔 为 7。 
(3) ARIMA 


ARIMA 模 型 全 称 为 差分 自 回 归 移 动 平 均 模型 (Autoregressive Integrated Moving Average Model) ， 它 指 将 非 平稳 时 间 序 列 转化 为 平稳 时 间 序 列 ， 然 后 将 因 变 量 仅 对 它 的 滞后 值 以 及 随机 误差 项 的 
现 值 和 滞后 值 进行 回归 所 建立 的 模型 。ARIMA 常 用 于 在 复杂 的 时 间 序列 中 进行 预测 ， 如 包含 季节 性 、 异 常 值 、 周 期 性 等 大 型 数据 预测 场景 。 


举例 : 本 章 图 8-1 即 使 用 了 ARIMA 模 型 预测 未 来 10 个 月 的 销售 情况 。 该 模型 请 参照 Clementine12 中 的 catalog forecast 流 ， 文 件 目录 是 Clementine12.0\DemosNClassification _ Module， 具 体 流程 请 
参照 “应 用 程序 示例 ” (在 帮助 窗口 中 可 找到 ) 。 为 了 实现 对 未 来 的 预测 功能 ， 在 原 有 模型 基础 上 进行 了 优化 。 


步骤 一 : 在 Time Intercals 节 点 的 预报 设置 中 ， 将 “预报 时 间 ” 设 置 为 10 (该 值 根 据 要 预测 的 实际 时 间 填 写 ) ，; 


步骤 二 : 在 “时 间 序 列 ” (men) 节点 中 ， 重 新 配置 模型 参数 ， 选 择 “专家 建 模 器 ”; 在 “标准 ”设置 中 ， 选 择 “ 离 群 值 ”并 勾 选 “自动 检测 离 群 值 ”， 再 勾 选 除 “ 添 加 本 地 程序 ”外 的 检测 选项 ， 


步骤 三 : 在 流 中 新 增 了 根据 最 新 调整 参数 和 预测 时 间 后 的 图 形 输出 和 表格 输出 ， 该 输出 可 用 于 趋势 判断 和 具体 数据 输出 使 用 。 完 整 模型 流 ， 如 图 8-7 所 示 。 
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图 8-7 Clementine 销 售 预测 流 模型 
3. 因 果 联 系 
因果 联系 分 析 方 法 中 最 常用 的 是 回归 分 析 ， 包 括 指数 回归 、 线 性 回归 、 多 项 式 方程 回归、 对 数 回归 等 。 
举例 : 使 用 Excel 2013 对 表 8-3 的 数据 做 因果 联系 的 预测 。 业 务 场 景 : 业务 部 门 有 50000 元 预算 ， 预 计 能 带 来 多 少 UV。 


表 8-3 每 日 费用 与 UV 数据 


日 其 费用 /元 UV/ 元 
2014/4/2 2014/4/12 24 000 120 000 
2014/4/3 2014/4/13 20 000 61 000 
2014/4/4 2014/4/14 36 000 119 000 
2014/4/5 2014/4/15 27 000 124 000 
2014/4/6 2014/4/16 18 000 63 000 
2014/4/7 2014/4/17 17 000 33 000 
2014/4/8 2014/4/18 32 000 57 000 
2014/4/9 2014/4/19 19 000 38 000 
2014/4/10 2014/4/20 24 000 63 000 


步骤 一 : 观察 数据 规律 。 通 过 Excel 画 出 散 点 图 并 分 析 图 形 的 分 布 规律 。 由 图 形 分 布 可 以 发 现 ， 该 图 形 符合 指数 或 多 项 式 条 件 下 的 数据 分 布 ; 


步骤 二 : 添加 趋势 线 。 选 中 其 中 的 任意 数据 点 ， 右 击 “ 添 加 趋势 线 ”。 


步骤 三 : 显示 公式 和 R。 在 出 现 的 “趋势 线 ” 选 项 中 分 别 选 择 指数 和 多 项 式 ， 并 勾 选 “显示 公式 ”和 显示 “R 平 方 值 ”。 
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: 调节 参数 。 调 节 多 项 式 中 的 “顺序 ” 值 ， 发 现 数据 值 越 大 ， 对 数据 的 拟 合 程度 越 好 (R* 越 大 ) ， 为 了 便于 理解 这 里 使 用 二 次 拟 合 ， 实 际 应 用 中 为 了 更 准确 地 描述 数据 应 尽量 选择 拟 合 程度 更 好 


步骤 五 : 应 用 拟 合 模型 。 图 8-8 所 示 的 是 二 次 多 项 式 下 的 拟 合 方程 和 拟 合 解释 系数 R“， 拟 合 的 回归 模型 如 下 。 


y=1E-04x2-2.3371x+65040 


备注 : x 的 系数 为 1E-04， 此 为 科学 计数 法 ; 1E-04=0.0001 


当 费 用 (x) 是 50000 时 ,预期 UV (y) 为 : 


y=1E-04 x 500002-2.3371 X 50000x+65040 和 198185 


归 分 析 应 用 案例 


y=1E-04x -2.3371x+ 65 040 ® 
R* = 0.7842 


10000 20000 30000 40000 50000 60000 /0000 


图 8-8 ”回归 分 析 应 用 案例 


;+ 总 y (UV 量 ) =1E-04x?-2.3371x+65040 模 型 仅 适 用 于 当 x 的 取 值 范围 在 14000~60000 之 间 ， 即 拟 合 数据 中 x 的 最 大 值 和 最 小 值 之 间 。 如 果 超 过 该 范围 ，y 的 拟 合 程度 无 法 保证 准确 性 。 


4. 特 征 关 系 


特征 关系 即 通 过 控制 对 结 


影响 较 大 的 过 程 要 素来 控制 结果 。 常 见 的 特征 关系 包括 决策 树 、 决 策 列表 等 数据 挖掘 方法 。 特 征 关系 预测 常用 于 业务 方 可 以 控制 对 结果 产生 影响 的 关键 因素 进而 预测 结果 ， 


预测 结果 通常 是 一 个 类 别 或 区 间 ， 如 是 否 响应 (响应 是 指 是 否 符合 业务 的 预测 订购 、 试 用 、 下 单 、 注 册 等 目标 ) 。 


举例 : 企业 现 有 13504 个 会 员 要 进行 促销 活动 营销 ， 一 种 方案 是 对 所 有 会 员 发 送 EDM， 另 一 种 方案 是 只 选择 其 中 最 有 响应 概率 的 用 户 进行 营销 ， 节 省 成 本 的 同时 又 能 保证 促销 效果 。 此 时 可 使 用 决策 树 


算法 针对 已 经 购买 客户 的 特征 进 


行 分 析 ， 从 而 找到 有 响应 (有 购买 客户 的 特征 ， 然 后 针对 这 些 特征 定位 其 他 目标 客户 。 数 据 结 果 ， 如 图 8-9 所 示 。 


和 过 四 分 位 数 (m) 


包括 提示 程序 的 所 有 自 13,504[ 1.953 
= inconmre, number_transactions 
income >» 55.267 和 2350 328 
number transactions = 3 


Sincome, rfm_score 
income > 55 267 和 


rm score = 10.53 和 
rm score a= 12.33 


Sincome, average#balancetfeed#index, call_cen 
income > 55 267 和 
averadge#balahcex#feed#ihdex > 124 和 
average#balance#feed#index <= 349 和 
call_center_contacts > 1 和 
tall_center_contacts <= 3 


图 8-9 ”特征 关系 预测 应 用 案例 


当选 择 特征 符合 收入 >55267 元 且 订 单 次 数 >3 的 用 户 群体 时 ， 预 计 响应 概率 达到 93.71% (此 时 样本 只 有 350， 意 味 着 只 能 发 送 350 个 用 户 ， 预 计 其 中 有 328 个 用 户 会 响应 ) ; 当选 择 特征 符合 收入 


>55267 元 且 RFM 得 分 >10.53 且 RFM 得 分 <12.33 的 用 户 群 体 时 ， 预 计 响 应 概率 只 有 88.539%6。 
8.2 ”以 结论 定义 为 目的 的 数据 分 析 


结论 定义 是 对 正在 发 生 的 现在 和 已 经 发 生 的 过 去 做 出 结果 判断 ， 以 评估 结果 是 否 符合 预期 或 存在 异常 情况 。 


结论 定义 并 不 是 简单 的 定义 结果 是 好 还 是 不 好 ， 而 是 要 进一步 定义 所 谓 的 好 或 者 不 好 属于 正常 还 是 异常 情况 ， 这 才 是 真正 的 数据 结论 定义 。 现 在 很 多 数据 分 析 师 在 给 出 结论 时 往往 是 这 样 的 陈述 “昨日 
比 前 日 增长 20%” “流量 下 降 400000”， 类 似 这 样 的 报告 不 属于 结论 定义 ， 这 只 是 数据 陈述 而 已 。 


结论 定义 最 常 应 用 的 场景 是 业务 状态 进行 时 和 业务 状态 完成 后 。 业 务 状态 进行 时 的 结论 定义 可 快速 帮助 业务 建立 实时 数据 反馈 机 制 ， 通 过 即时 的 数据 结果 判断 是 否 符合 预期 ， 并 可 通过 措施 优化 当前 业 
务 状态 ; 业务 状态 完成 后 的 结论 定义 除了 可 以 做 业务 效果 评估 外 ， 还 为 原因 解析 和 数据 探究 提供 了 方向 。 


常见 的 结论 定义 场景 如 下 : 

. 昨日 订单 量 超过 30000 单 ， 超 过 正常 水 平 230%。 

. 过 去 的 1 小 时 内 流量 突然 下 降 了 75%， 这 是 一 个 异常 的 预警 信号 。 
. 过 去 一 周 内 的 注册 会 员 量 环比 增长 7m%， 这 是 正常 波动 。 


. 上 晚上 6 点 流量 下 降 到 500000 在 线 UV， 这 是 正常 的 流量 下 降 。 


8.2.2 结论 定义 的 4 种 方向 


结论 定义 的 4 种 方向 包括 引起 关注 的 正 向 值 、 正 常 波动 的 正常 值 、 正 常 波动 的 负 向 值 、 引 起 预警 的 负 向 值 。 图 8-10 所 示 为 观测 数据 集 有 一 个 均值 ， 位 于 均值 上 下 各 有 一 个 正常 向 上 的 波动 学 围 ， 如 果 数 
据 上 下 波动 超过 正常 范围 就 会 形成 异常 值 。 图 8-10 中 A、B、C、D 分 别 是 引起 关注 的 正 向 值 、 正 常 波动 的 正常 值 、 正 常 波动 的 负 向 值 和 引起 预警 的 负 向 值 。 


数据 结论 的 四 种 方 同 


一下 于 衣 动 下 限 均值 ”=e_— 上 上 党 流 荔 上 限 


异常 增长 区 间 


异 钊 下 降 区 间 


图 8-10 ”数据 结论 定义 的 四 种 方向 
1. 引 起 关注 的 正 向 值 
引起 关注 的 正 向 值 指数 据 结果 已 经 超出 正常 波动 的 上 限 ， 属 于 趋 好 的 异常 值 ， 这 种 值 的 结果 如 图 8-10 中 的 A 点 ， 数 据 位 于 正常 波动 上 限 的 上 方 。 
为 什么 要 定义 这 个 区 间 值 ? 
在 实际 业务 中 ， 数 据 会 因为 各 种 原因 而 导致 结果 高 于 或 低 于 预期 ， 定 义 引 起 关注 的 正 向 值 区 间 ， 可 以 帮助 业务 过 滤 信息 噪点 而 真正 定位 和 分 析 异 常 增长 情况 。 
图 8-10 中 A 点 定义 的 结论 可 能 是 : 昨日 流量 增长 了 300000 (或 28%) ， 增 长 数据 显示 已 经 超过 优化 所 能 带 来 的 正常 水 平 ， 需 要 引起 重点 关注 。 
2. 正 常 波 动 的 正 向 值 
正常 波动 的 正 向 值 与 引起 关注 的 正 向 值 都 属于 结果 高 于 预期 的 情况 ， 但 在 这 种 情况 下 即使 出 现 较 大 幅度 的 增长 也 属于 “正常 情况 ”。 


在 实际 业务 中 ， 业 务 可 能 将 高 于 预期 的 结果 认为 是 自身 业务 动作 带 来 的 成 果 ， 但 实际 上 结果 可 能 只 是 受 其 他 因素 导致。 以 图 8-10 中 的 B 点 为 例 ， 假 设 该 点 是 一 天 中 22 点 的 流量 数据 ， 通 过 数据 分 析 发 现 
该 点 数据 虽然 高 于 均值 一 定 比 例 ， 但 其 实 可 能 受用 户 自然 访问 行为 的 影响 (通常 ， 晚 上 22 点 是 一 天 内 流量 较 高 的 时 间 段 ) ， 即 使 没有 此 时 的 业务 动作 ， 流 量 依然 会 高 于 正常 水 平 。 


3. 正 常 波 动 的 负 向 值 

正常 波动 的 负 向 值 与 正常 波动 的 正 向 值 相反 ， 该 结果 反映 的 是 数据 虽然 低 于 正常 水 平 ， 但 也 属于 “正常 情况 ”。 

以 图 8-10 中 的 C 点 为 例 ， 假 设 该 点 是 周 六 的 订单 量 ， 由 数据 可 知 虽 然 订单 量 低 于 平均 水 平 ， 但 仍然 处 于 正常 情况 〈 周 六 用 户 自然 访问 行为 减少 ， 订 单 量 低 于 其 他 时 间 ) 。 
4. 引 起 预警 的 负 向 值 


引起 预警 的 负 向 值 是 数据 低 于 正常 波动 的 下 限 ， 出 现 异 常 低 的 情况 。 该 结果 已 经 排除 了 正常 下 降 波动 导致 的 数据 减少 ， 意 味 着 已 经 出 现 严重 的 低 于 预期 的 情况 。 对 于 该 情况 需要 立即 通报 相关 部 门 或 负 
责 人 引起 重视 。 


以 图 8-10 中 的 D 点 为 例 ， 假 设 该 点 是 网 站 某 日 的 转化 率 数据 ， 该 转化 率 仅 有 0.3%， 即 使 考虑 到 用 户 自然 访问 、 站 外 推广 渠道 等 因素 ， 该 数据 的 异常 下 降 也 是 异常 情况 。 
8.2.3 结论 定义 的 3 个 误区 
看 似 简单 的 数据 结论 定义 ， 很 多 时 候 数据 分 析 师 会 出 现 各 种 错误 认识 ， 表 现在 把 数据 陈列 当做 数据 结论 、 数 据 结论 产生 于 单一 指标 甚至 人 存在 数据 立场 扭曲 的 数据 结论 。 


1. 把 数据 陈列 当做 数据 结论 


把 数据 陈列 当做 数据 结论 指数 据 报告 中 的 结论 全 部 都 是 数字 的 简单 陈述 ， 通 俗 点 进 就 是 “读数 ”。 这 种 问题 常见 于 日 常 报告 ， 如 日 报 、 周 报 、 月 报 等 带 规 性 报告 ， 报 告 内 容 以 阶段 性 总 结 和 汇总 为 主 ， 
报告 中 没有 深度 分 析 的 内 容 。 


将 报告 中 的 数据 简单 陈列 出 来 的 情况 通常 称 为 数据 事实 ,数据 事实 与 数据 结论 的 区 别 在 于 : 数据 事实 是 将 数据 陈列 ， 不 涉及 好 、 坏 、 优 、 务 的 定性 ;而 数据 结论 需要 将 数据 事实 结合 业务 目标 和 实际 情 
况 定性 为 好 、 坏 、 优 、 务 等 。 数 据 事 实 与 数据 结论 的 联系 在 于 : 数据 事实 和 数据 结论 是 日 党 总 结 性 报告 中 不 可 缺少 的 两 个 部 分 ， 前 者 以 数据 的 形式 直接 反映 结果 ， 后 者 从 数据 分 析 的 角度 定性 该 结果 并 阐述 
了 该 结果 的 影响 。 


举例 : 表 8-4 是 一 份 网 站 流量 日 报 数据 的 一 部 分 。 


表 8-4 某 日 报 数据 


在 该 报告 中 的 数据 结论 定义 可 能 有 以 下 两 种 。 


第 一 种 : 数据 事实 。 

2014-04-22 网 站 访问 量 为 8745， 环 比 增长 33%; 页 面 浏览 量 33101， 环 比 增长 54%; 跳出 率 62%， 环比 提高 42%; 新 访问 占 比 46%， 环 比 提高 18%; 访问 深度 3.8， 环 比 提高 16%。 
大 多 数 日 常 报告 的 结论 可 能 就 是 类 似 于 以 上 的 数字 陈述 ， 报 告 中 不 存在 任何 结论 。 这 种 工作 通常 不 能 被 视 为 一 份 报告 ， 而 是 一 个 电子 表格 或 数据 ， 可 以 通过 系统 报表 自动 实现 。 
第 二 种 : 数据 结论 。 

真正 的 数据 结论 是 什么 ? 以 表 8-4 数 据 为 例 ， 结 论 可 能 如 下 : 

2014-04-22 全 站 整体 流量 环比 比 2014-04-21 有 大 幅度 提升 。 一 一 这 是 一 个 总 的 结论 。 

网 站 访问 量 8745， 环 比 增长 33%; 页 面 浏览 量 33101， 环比 增长 54%。 一 一 数据 陈述 。 

网 站 访问 量 和 页 面 浏 览 量 增长 比例 较 大 有 征 超 出 正常 波动 范围 ， 需 要 相关 部 门 (具体 负责 的 部 门 ) 关注 。 一 一 数据 结论 定义 为 增长 ， 增 长 状态 为 超过 正常 范围 。 

跳出 率 62%， 环比 提高 42%。 一 一 数据 陈述 。 

意味 着 用 户 访问 到 达 着 陆 页 后 马上 离开 网 站 的 比例 大 幅度 提高 ， 且 提高 的 比例 超过 了 正常 波动 的 下 限 范 围 ， 这 是 一 个 预警 信号 。 一 一 数据 结论 定性 为 数据 下 降 到 预警 范围 。 
访问 深度 3.8， 环 比 提高 16%。 一 一 数据 陈述 。 

属于 正常 波动 范围 。 一 一 定性 结论 。 

完整 的 日 报 结论 部 分 如 下 : 


2014-04-22 全 站 整体 流量 环比 比 2014-04-21 有 大 幅度 提升 。 网 站 访问 量 8745， 环 比 增长 33%; 页 面 浏览 量 33101， 环 比 增长 54%。 网 站 访问 量 和 页 面 浏览 量 增长 比例 较 大 且 超 出 正常 波动 范围 ， 需 要 
相关 部 门 关 注 。 跳 出 率 62%6， 环 比 提高 42%， 意 味 着 用 户 访问 到 达 着 陆 页 后 马上 离开 网 站 的 比例 大 幅度 提高 ， 且 提高 的 比例 超过 了 正常 波动 的 下 限 范围 ， 这 是 一 个 预警 信号 。 访 问 深度 3.8， 环 比 提高 16%6， 
属于 正常 波动 范围 。 


以 上 结论 只 是 一 个 示例 ， 在 实际 业务 中 会 根据 汇报 对 象 的 层次 、 理 解 水 平 、 对 数据 的 认识 程度 以 及 听 汇 报 的 习惯 重新 组 织 语言 和 格式 等 。 另 外 ， 由 于 没有 对 其 他 数据 进行 相关 性 分 析 ， 无 法 提炼 出 某 些 
指标 的 直接 对 接 和 负责 部 门 ， 实 际 应 用 中 需要 根据 当前 部 门 分 工 以 及 工作 重点 ， 将 各 个 指标 的 负责 部 门 联系 起 来 ， 以 便 产 生 数 据 驱 动 效 应 。 


2. 数 据 结 论 产 生 于 单一 指标 


数据 结论 产生 于 单一 指标 指 当 前 结论 的 来 源 是 某 个 指标 ， 而 非 全 面 的 数据 指标 。 这 是 普遍 存在 于 日 常 报告 中 的 结论 定义 错误 ， 原 因 是 单一 指标 无 法 全 面 衡 量 某 一 业务 效果 。 比 如 ，2014-04-22 全 站 订单 
量 提 升 20% 并 不 意味 着 全 站 销售 效果 提升 ， 还 需要 根据 客 单价 、 实 际 慨 投 率 等 做 综合 评估 。 


举例 : 表 8-4 中 有 三 个 针对 网 站 流量 质量 的 评估 指标 一 一 跳出 率 、 新 访问 占 比 和 访问 深度 ， 虽 然 这 三 个 指标 的 环比 上 升 ， 但 反映 的 趋势 不 完全 一 致 。 


" 跳出 率 的 提升 是 业务 方 不 希望 看 到 的 结果 ， 该 结果 意味 着 流量 质量 不 高 (暂且 不 论 是 站 外 流量 质量 问题 还 是 站 内 落地 页 设计 问题 ) 。 


:新 访问 占 比 虽 然 有 提升 ， 但 无 法 判断 提升 对 业务 是 好 还 是 坏 ， 原 因 是 企业 不 同 阶段 及 业务 不 同 目标 决定 了 该 目标 的 趋向 。 如 果 业 务 目标 是 扩大 品牌 认 知 ， 那 么 需要 提高 对 新 用 户 的 履 盖 度 ， 此 时 数据 
目标 是 提高 新 访问 占 比 ; 如 果 业 务 目标 是 增加 老 用 户 回访 体验 活动 ， 那 么 需要 提高 老 用 户 访问 占 比 。 


* 访问 深度 的 提升 是 一 个 积极 的 效果 ， 意 味 着 用 户 浏览 的 页 面 数量 增加 。 

假设 只 有 三 个 网 站 流量 质量 评估 指标 (实际 情况 中 不 只 三 个 ) ， 其 中 任何 一 个 都 无 法 全 面 说 明 网 站 的 质量 情况 。 

3. 数 据 立 场 扭曲 的 数据 结论 

数据 立场 扭曲 的 数据 结论 指 用 分 析 师 的 立场 扭曲 客观 事实 ， 这 种 情况 常见 于 数据 分 析 师 已 经 具备 某 种 认 知 ， 而 只 选择 符合 其 预期 的 结论 做 定义 。 关 于 数据 立场 的 问题 在 本 书 其 他 章节 有 多 次 提 到 ， 在 此 
不 过 多 陈述 。 


8.2.4 下 结论 的 常用 方法 


下 结论 的 方法 有 很 多 种 ， 如 对 比 法 、 平 均 数 法 、 变 化 比例 法 等 ， 这 些 都 是 简单 地 将 数据 进行 对 比 ， 然 后 下 结论 。 在 此 介绍 另外 一 种 相对 科学 的 下 结论 的 方法 一 一 利用 正 态 分 布 规律 来 判断 数据 表现 。 


正 态 分 布 的 应 用 前 期 是 当 所 要 应 用 的 数据 无 穷 多 时 ， 数 据 分 布 符合 正 态 分 布 规律 ， 即 以 均值 为 对 称 中 心 均匀 分 布 的 钟 形 曲 线 。 正 态 分 布 规律 广泛 应 用 于 自然 界 统计 、 数 学 、 工 程 学 、 医 学 、 社 会 学 、 人 
口 统计 学 、 心 理学 、 物 理学 等 大 数据 量 领域 。 


正 态 分 布 的 基本 特征 如 下 。 

集中 性 : 正 态 曲 线 的 高 峰 位 于 正中 央 ， 即 均 数 所 在 的 位 置 。 

` 对 称 性 : 正 态 曲线 以 均 数 为 中 心 ， 左 右 对 称 ， 曲 线 两 端 永远 不 与 横 轴 相交 。 
均匀 变动 性 : 正 态 曲线 由 均 数 所 在 处 开始 ， 分 别 向 左右 两 侧 逐 渐 均 匀 下 降 。 

图 8-11 所 示 为 一 条 典型 的 正 态 分 布 曲线 ， 曲 线 中 H (均值) 为 对 称 轴 ，o 为 标准 差 。 
正 态 分 布 中 有 一 种 特殊 情况 一 一 标准 正 态 分 布 ， 其 特征 如 下 。 

标准 正 态 分 布 以 4 (均值 ) 为 对 称 轴 ， 均 数 、 中 位 数 、 众 数 相等 。 


* 标准 正 态 分 布 曲线 下 的 面积 存在 一 定 的 规律 : 在 正 负 一 个 标准 差 内 的 面积 约 为 68.26%， 在 正 负 两 个 标准 差 内 的 面积 约 为 95.44%， 在 正 负 三 个 标准 差 内 的 面积 约 为 99.97%。 基 本 可 以 认为 ， 所 有 的 数据 
都 会 分 布 在 正 负 三 个 标准 差 之 内 ， 这 在 统计 学 上 称 为 “3c 准 则 ”。 
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图 8-11 正 态 分 布 曲线 


0.0 0.1 


基于 数据 的 标准 正 态 分 布 特征 ， 数 据 区 域 被 h_ (均值 ) 和 a (标准 差 ) 分 为 8 个 区 域 : -3a 之 外 、-3a~ -20G、-2G~-16G、-1aG~H、H=~16G、Hh~20G、H~3G、30 之 外 。 
该 规律 可 应 用 到 数据 结论 的 定义 过 程 中 ， 具 体 定义 如 下 : 

. 当 数 据 位 于 -1o~h 时 ， 数 据 处 于 正常 波动 的 下 降 区 间 ; 

. 当 数 据 位 于 h~10 时 ， 数 据 处 于 正常 波动 的 增长 区 间 ; 

. 当 数 据 位 于 -1c 之 外 时 ， 数 据 处 于 引起 预警 的 负 向 值 区 间 ; 

. 当 数 据 位 于 1c 之 外 时 ， 数 据 处 于 隐 去 关注 的 正 向 值 区 间 。 

举例 : 以 表 8-5 的 数据 为 例 说 明 如 何 使 用 标准 正 态 分 布 做 数据 结论 定义 。 


表 8-5 每 日 访问 量 数 据 


| | 
2014-4-3 6248 2014-4-13 2014-4-23 
2014-4-5 2014-4-15 2014-4-25 
2014-4-7 5563 2014-4-17 一 2014-4-27 
2014-4-10 


步骤 一 : 选择 数据 集 。 假 如 我 针对 访问 量 做 标准 正太 分 布 分 析 ， 需 要 选择 一 定 


味 着 数据 无 法 有 反映 趋势 ， 数 据 量 过 大 意味 着 近期 的 数据 会 受到 太 早 时 间 的 影响 而 失去 最 近 分 布 特征 ) ， 
步骤 二 : 计算 数据 均值 和 标准 差 。 这 里 以 Excel 2013 为 例 ， 通 过 Excel 自 带 的 描述 性 统计 自动 计算 。 点 击 项 部 菜单 栏 


的 “数据 分 析 ” 窗 口中 选择 “描述 统计 ”， 单 击 “ 确 定 ” 按 钮 。 设 置 数 据 输入 区 域 和 输出 区 域 ， 义 选 
平均 、 标 准 误 差 、 中 位 数 等 13 个 基本 统计 指标 ， 其 中 平均 h=5928.633， 标 准 差 c=1196.363。 


日 期 访问 量 
2014/14111 
2014/4/21 
2014/4/3! 
2014/4/4! 
2014/4/5! 
2014/4/61 
20141417! 
2014/4/8! 
2014/4/9! 

2014/4/10! 

201414111i 

2014/14/121 

2014/4113| 

2014/41141! 

2014/4115| 

2014/41181 

2014/4/171 


标志 位 于 第 一 行 山 ) 


辆 出 和 迹 项 

入 辆 出 区 域 (QQ): 

名 新 工作 表 组 (P}: 
名) 新 工作 落 (W) 

起 总 统计 (S) 

王 均 数 症 信和 度 (N): 
第 发 大 值 节 ): 

第 长 小 值 (让 ): 


号 


图 8-12 “描述 统计 ”设置 及 结果 
@ia 示 在 Excel 中 也 可 以 直接 使 用 函数 计算 均值 和 标准 差 ， 均 值 的 函数 为 AVERAGE， 标 准 差 范 数 为 STDEV.S。 
步骤 三 : 计算 数据 区 间 如 下 。 

u-1o=5928.63-1 X1196.36=4732.27 
ut+1o=5928.63+1 X1196.36=7124.99 

步骤 四 : 应 用 数据 区 间 。 假 设 每 天 的 访问 量 为 x， 那 么 x 的 区 间 如 下 (由 于 访问 量 不 
" 当 4732<x<5929 时 ， 数 据 处 于 正常 波动 下 降 区 间 ; 
. 当 5929<x<7125 时 ， 数 据 处 于 正常 波动 的 增长 区 间 ; 
" 当 x<4732 时 ， 数 据 处 于 引起 预警 的 负 向 值 区 间 ; 
: 当 x<5929 时 ， 数 据 处 于 引起 关注 的 正 向 值 区 间 。 


通过 以 上 步骤 即 可 定义 出 各 个 结论 区 间 ， 同 时 还 可 以 在 此 基础 上 新 增 两 个 区 间 ， 即 在 +2a 之 外 新 增 特 殊 提 


能 为 小 数 ， 这 里 做 四 舍 五 入 处 理 ) 。 


“数据 一 数据 分 析 ” 


[ET 下 


(如 果 没 有 启用 该 选项 
“汇总 统计 ”并 单 击 “ 确 定 ” 按 钮 。 关 于 所 选择 数据 集 的 描述 性 统计 结果 已 


高 和 特殊 下 降 的 预警 值 ， 定 义 逻 辑 和 步骤 类 似 。 


可 参考 8.1.4 指 数 平滑 中 的 步骤 ) ， 
么 计算 完成 ， 图 8-12 所 示 为 


访 


问 量 


量 的 原始 数据 集 。 为 了 更 好 地 反映 数据 趋势 ， 建 议 选择 最 近 时 间 的 不 少 于 1 个 月 且 同 时 不 大 于 3 个 月 的 数据 (数据 量 过 小 意 
具体 视 数据 量 而 定 。 考 虑 到 篇 幅 本 书 只 选择 一 个 月 的 数据 作为 示例 。 


访问 量 


平均 
标准 误 替 
中 位 数 
众 数 
标准 差 
方 奔 


5928.633 
218.4249 
852.5 

并 MA 
1196.363 
1431283 
-1.13099 
DQ.093939 
dr15 
4141 
1916 
171859 
0 


在 弹出 


8.3 ”以 数据 探究 为 目的 的 数据 分 析 


8.3.1 数据 探究 是 什么 
数据 探究 指 对 数据 进行 探索 和 研究 以 便 发 现 进一步 的 数据 观点 和 数据 洞察 。 数 据 探究 是 挖掘 数据 深层 次 原因 和 关系 的 关键 动作 ， 也 是 数据 论证 的 主要 过 程 ， 表 现在 数据 结果 中 大 多 是 数据 论证 过 程 。 数 


据 探 究 是 项 目 类 、 专 题 类 数据 分 析 和 数据 挖掘 报告 及 项 目的 核心 部 分 。 


8.3.2 ”数据 探究 的 两 种 类 型 


数据 探究 主要 应 用 于 针对 已 知 结论 的 数据 研究 ， 另 外 还 存在 针对 未 知 结论 的 数据 挖掘 。 
1. 已 知 结论 的 数据 研究 
已 知 结论 是 已 经 明确 或 知晓 的 结论 ， 如 订单 增长 77%、 注 册 量 下 降 7899 等 。 
针对 已 知 结论 的 数据 研究 即 围绕 已 知 结论 进行 数据 分 析 和 挖掘 ， 以 找到 导致 结果 发 生 的 原因 。 在 业务 应 用 中 ， 是 针对 业务 提出 的 具体 问题 进行 分 析 ， 侧 重 于 “为 什么 ”的 答疑 解 惑 ， 例 如 : 
* 昨日 网 站 访问 量 提高 77%， 是 哪些 原因 时 致 访问 量 突然 增加 ? 
. 最 近 一 周公 司 日 均 注册 量 下 降 7899， 是 什么 原因 导致 注册 量 下 降 得 如 此 严重 ? 
“ 最 近 网 站 订单 转化 率 提 升 15%， 是 由 于 购物 车 、 流 量 提高 还 是 站 内 活动 等 因素 导致 ? 
2. 未 知 结论 的 数据 挖掘 
针对 未 知 结论 的 数据 挖掘 指 在 数据 研究 之 前 没有 明确 的 数据 结论 ， 只 围绕 某 一 汉 围 或 主题 开展 数据 挖掘 工作 ， 以 便 寻 找 结 论 和 原因 的 过 程 。 
针对 未 知 结论 的 数据 挖掘 是 拓展 业务 知识 的 重要 途径 ， 相 比较 针对 已 知 结论 的 数据 研究 ， 该 过 程 更 侧重 于 “是 什么 ”的 工作 学 畴 ， 常 见 场景 如 下 : 
“ 不 同 的 商品 是 如 何 关联 销售 的 ? 
. 企业 整体 用 户 特征 是 怎样 的 ? 
“页面 商 品 布 局 中 ， 哪 些 因素 会 提高 页 面 点 击 购买 转化 率 ? 
js 在 数据 应 用 过 程 中 ， 针 对 未 知 结论 的 数据 挖掘 的 业务 认同 价值 要 高 于 已 经 知道 的 结论 ; 同时 ， 针 对 业务 已 经 知道 的 结论 进行 重复 论证 的 工作 价值 认同 度 非常 低 。 比 如 A、B 测 试 结果 反映 出 两 


个 版 本 的 目标 转化 率 分 别 是 5% 和 8%， 业 务 方 只 看 结果 数据 就 知道 8% 效 果 更 好 ; 如 果 数 据 分 析 师 仍然 通过 复杂 算法 或 检验 得 出 了 8% 比 5% 更 具有 显著 性 ， 那 么 该 结论 意义 非常 小 。 


8.3.3 ”探究 原因 的 分 析 方 法 


探究 原因 的 分 析 方 法 有 很 多 ， 包 括 细 分 分 析 、 漏 斗 分析 、 路 径 分 析 、 相 关 性 分 析 等 
1. 细 分 分 析 

分 分 析 是 网 站 分 析 的 基本 方法 ， 也 是 数据 分 析 的 基本 思路 。 细 分 分 析 的 过 程 是 对 整体 数据 进行 拆 分， 然后 找到 影响 整体 的 主要 局 部 因素 。 
举例 : 表 8-6 显 示 了 全 站 昨日 访问 量 环比 增长 1888， 变 化 比例 为 399% ， 要 针对 该 结论 进行 分 析 只 需要 将 来 源 渠道 做 细 分 (下 钻 ) 即 可 。 


表 8-6 访问 量 细 分 数据 


一 级 维度 变化 比例 /% 


3289 of 
2330 83 
391] 0 
348 39 
320 一 ] 2 
70 41 


步骤 一 : 全 站 流量 按 来 源 模 块 可 细 分 为 广告 、SEM、SEO 和 直接 输入 (假设 只 有 4 个 模块 ) 。 细 分 发 现 广 告 是 网 站 流量 的 主要 来 源 (昨日 访问 量 占 比 为 82%) ， 访 问 量 增 长 2194， 变 化 比例 为 67%， 说 
明了 广告 是 网 站 访问 量 增长 的 主要 驱动 因素 。 

步骤 二 : 对 广告 模块 做 进一步 细 分 ， 发 现 其 中 主要 增长 模块 为 Sina， 该 模块 昨日 访问 量 占 比 799%， 环 比 前 日 增长 1990， 变 化 比例 为 85%。 如 果 该 模块 有 不 同 的 位 置 ， 还 可 以 做 进一步 细 分 。 

至 此 已 经 找到 了 昨日 网 站 访问 量 增 长 的 主要 原因 是 Sina 来 源流 量 增 长 ， 此 时 可 直接 找到 Sina 模 块 的 业务 负责 人 进行 进一步 的 沟通 。 


@ia 示 在 上 述 细 分 分 析 过 程 中 ， 虽 然 整 体 访问 量 上 升 ,但 是 我 们 发 现 部 分 模块 流量 下 降 且 比例 较 大 ， 如 SEM 下 降 比 例 为 12%。 这 种 权重 较 小 的 数据 异常 往往 容易 掩盖 在 整体 数据 之 下 ， 此 时 数据 从 业 
者 可 针对 该 问题 提出 质疑 和 分 析 。 


2. 漏 斗 分 析 


漏斗 分 析 是 网 站 分 析 的 基本 方法 ， 根 据 漏斗 的 封闭 性 可 分 为 封闭 型 漏斗 和 开放 型 漏斗 。 


封闭 型 漏斗 指数 据 从 第 一 环节 开始 到 最 后 的 环节 ， 数 据 从 上 一 环节 开始 依次 “ 漏 ” 下 来 ， 不 人 存在 其 他 进入 途径 。 典 型 的 封闭 型 漏斗 是 购物 车 流程 ， 通 常情 况 下 从 加 入 购物 车 开始 ， 用 户 依次 进入 结算 和 
提交 订单 ， 因 此 形成 加 入 购物 车 一 结算 一 提交 订单 ， 在 此 过 程 中 不 可 能 从 其 他 环节 直接 进入 。 


开放 型 漏斗 指数 据 的 各 个 环节 都 有 可 能 人 存在 其 他 入 口 ， 整 个 漏斗 不 封闭 。 典 型 的 开放 型 漏斗 是 全 站 购物 流程 漏斗， 漏斗 是 到 达 着 陆 页 一 查看 产品 页 一 加 入 购物 车 ， 在 整个 过 程 中 ， 用 户 查 看 产品 
页 和 加 入 购物 车 可 能 从 任何 一 个 具备 该 功能 的 入 口 进入 ， 而 不 一 定 是 从 着 陆 页 进入 。 


漏斗 分 析 的 典型 应 用 场景 是 分 析 站 内 流程 ， 如 注册 流程 、 购 物 车 流程 等 ; 除了 可 以 针对 多 页 面 的 流程 进行 分 析 外 ， 还 可 以 针对 单 页 面 的 多 个 步骤 ， 如 表单 分 析 。 


举例 : 表 8-7 的 漏斗 分 析 数 据 显 示 了 网 站 的 订单 转化 率 只 有 5.39% ， 通 过 漏斗 分 析 发 现 ， 总 访问 量 中 加 入 购物 车 转化 率 仅 有 18% ， 该 节点 是 整个 流程 中 流失 比例 最 大 的 部 分 。 因 此 ， 要 提高 网 站 整体 转化 
情况 ， 加 入 购物 车 是 重要 的 内 部 优化 节点 之 一 。 


表 8-7 ”漏斗 分 析 数 据 


项 目 名 称 转 化 上 一 步 转化 率 
访问 是 一 


加 入 购物 车 转化 457 18% 

车 和 转化 5 

说 单 转 化 1 33 A4496 
3. 路 径 分 析 


路 径 分 析 也 是 网 站 分 析 的 基本 方法 ， 借 助 于 网 站 数据 的 可 跟踪 和 可 监测 特征 ， 所 有 用 户 行为 都 处 于 可 分 析 的 状态 。 
路 径 常 用 来 分 析 不 同 页 面 间 的 流量 转化 情况 ， 典 型 应 用 如 下 : 
` 活动 主 会 场 /网 站 主页 面 如 何 导 流 ? 
` 用 户 是 否 按照 “预期 ”的 流程 行动 ? 
" 购买 “手机 的 用 户 ” 的 浏览 习惯 是 怎样 的 ? 
渠道 A 集 中 访问 了 某 条 路 径 ， 是 否 是 “恶意 流量 ”? 
关于 路 径 分 析 的 基本 原理 和 应 用 在 本 书 之 前 的 工具 相关 功能 中 已 经 详细 介绍 ， 在 此 不 做 过 多 重复 。 
4. 相 关 性 分 析 
相关 性 分 析 指 对 多 个 具备 相关 关系 的 变量 进行 分 析 ， 从 而 衡量 变量 间 的 相关 程度 或 密切 程度 。 相 关 性 可 以 应 用 到 所 有 数据 的 分 析 过 程 中 ， 任 何事 物 之 间 都 存在 一 定 的 联系 。 


相关 性 不 等 于 因果 联系 ， 相 关 性 和 因果 联系 可 以 用 一 个 案例 来 说 明 : 做 商品 促销 活动 ， 由 于 价格 折扣 低 导 致 网 站 订单 量 大 增 ， 因 此 线 下 的 配送 订单 量 需求 很 大 ， 在 这 个 过 程 中 ， 由 于 订单 配送 量 大 及 其 
他 原因 导致 配送 期 间 的 破损 率 增加 。 


在 这 个 案例 中 ， 商 品 折扣 低 与 破损 率 增 加 并 不 是 因果 关系 ， 即 不 能 说 因为 商品 折扣 低 所 以 商品 破损 率 增加 ， 两 者 之 间 是 相关 关系 。 
举例 : 以 表 8-8 相 关 性 分 析 数 据 为 例 ， 使 用 PASW Statistics 18 做 关于 网 站 访问 量 、 收 入 、 加 入 购物 车 转化 率 和 订单 转化 率 的 相关 性 分 析 。 
表 8-8 相关 性 分 析 数 据 
日 期 加 入 购物 车 转化 率 /% 订单 转化 率 /% 


2012-04-19 129 338 4 339 131 2.] ln 


步骤 一 : 数据 录入 。 将 表 中 除 日 期 外 的 数据 粘贴 到 PASW Statistics 18 输 入 栏 区 域 ， 并 重 命名 变量 视图 中 的 变量 名 称 。 注 意 ， 百 分 比 数据 要 转化 成 数值 格式 ， 否 则 PASW statistics 18 将 不 能 正确 识别 。 
录入 的 数据 ， 如 图 8-13 所 示 。 


加 入 购物 车 转化 率 | 。 订单 转化 率 


1087702.00 9047137.00 Qa240 


882122.00 6350039.00 0240 


B78628.00 111F4066.00 


866888.00 12033969.00| 


836382.00 Toee6u .00 


B04047.00 B858197.00 


ri2361.00 4844756.00 


rf24358.00 4359131.00 


图 8-13 ”将 数据 录入 PASW Statistics 18 


步骤 二 : 相关 性 分 析 。 点 击 项 部 “分 析 一 相关 一 双 变 量 ”， 进 入 相关 性 分 析 设 置 界面 ， 如 图 8-14 所 示 ， 将 左 侧 变量 选中 后 拖 入 右 侧 变量 分 析 区 域 。 依 次 选择 “和 尔 森 算法 ”“ 双 侧 检验 ”， 然 后 单 击 “ 确 
定 ” 按 钮 。 


眉 江东 妆 


Pearson | 局 Kendall gy] tau-b(k) Spearman 


性 知性 检验 
加 汉人 出 检验 全 ) 总 单 全 检验 仙 ) 


标记 显 竺 性 相去 全 ) 


图 8-14 “ 双 变 量 相关 ”设置 界面 


步骤 三 : 相关 性 解读 。 图 8-15 所 示 为 相关 性 分 析 结果 ， 它 是 一 个 相关 系数 和 矩阵， 从 上 到 下 或 从 左 到 右 的 解读 结果 相同 。 现 以 “会 话 ” 列 作为 解读 列 ， 从 上 到 下 依次 查找 和 矩阵 数据 得 到 相关 性 结果 : 会 话 


与 收入 的 相关 性 为 0.499、 与 加 入 购物 车 转化 率 的 相关 性 为 -0.193、 与 订单 转化 率 的 相关 性 为 -0.257。 该 结果 说 明了 会 话 与 收入 成 正 相 关 、 与 加 入 购物 车 转化 率 和 订单 转化 率 成 负 相关 ， 且 会 话 与 收入 相关 性 
较 大 。 


相关 性 


一 | 


Pearson 相关 性 
显 关 性 ( 双 侧 ) 


N 
Pearson 相关 性 
显著 性 ( 双 侧 ) 


N 

加 入 购物 车 转化 率 Pearson 相关 性 
显著 性 ( 双 侧 ) 
N 

汀 单 转 化 率 Pearson 相关 性 
显 痢 性 ( 双 侧 ) 
N 


图 8-15 ”相关 性 分 析 结 果 
**. 在 0.01 水 平 ( 双 侧 ) 上 显著 相关 。 


除了 以 上 分 析 方 法 外 ， 本 章 前 面 以 效果 预测 和 结论 定义 为 目的 的 分 析 中 的 数据 分 析 方 法 ， 也 都 可 以 应 用 到 对 于 原因 的 探究 过 程 中 ， 在 此 不 做 重复 介绍 。 


8.4 ”以 业务 执行 为 目的 的 数据 分 析 


8.4.1 业务 执行 是 什么 


用 于 以 业务 执行 为 目的 的 数据 分 析 指 数据 分 析 结 果 可 以 直接 被 业务 使 用 。 


N 


类 场景 常见 于 业务 有 明确 的 行动 目标 ， 但 需要 找到 一 定 特征 的 数据 要 素 作为 业务 执行 的 参照 ， 常 见 的 应 用 场景 如 下 : 


这 


. 现 要 针对 可 能 会 流失 的 会 员 做 会 员 重 新 激活 ， 应 该 挑选 具有 什么 特征 的 会 员 ? 
“ 商品 A 库 存 大 量 积 压 ， 现 要 将 该 商品 进行 捆绑 和 搭配 销售 ， 应 该 选择 哪些 商品 作为 捆绑 对 象 ? 


* 网 站 需要 新 增 广告 位 以 满足 越 来 越 多 的 商家 广告 需求 ， 应 该 在 哪些 位 置 新 增 广告 位 ? 


8.4.2 ”业务 执行 的 两 种 类 型 


业务 执行 根据 具体 规则 是 否 明确 可 分 为 明确 的 业务 执行 规则 和 模糊 的 业务 执行 规则 。 
1. 明 确 的 业务 执行 规则 


明确 的 业务 执行 规则 指数 据 规则 可 直接 被 业务 使 用 ， 如 针对 本 节 开 头 的 几 个 问题 ， 明 确 的 业务 执行 规则 可 能 如 下 : 


` 现 要 针对 网 站 预计 会 流失 的 会 员 做 会 员 挽 回 ， 应 该 挑选 具有 什么 特征 的 会 员 ? 一 一 收入 >5400 元 ， 最 近 购 买 时 间 是 5 个 月 之 前 ， 总 订单 金额 在 4300 元 以 下 的 会 员 。 
“ 商品 A 库存 大 量 积压 ， 现 要 将 该 商品 进行 捆绑 和 搭配 销售 ， 应 该 选择 哪些 商品 作为 捆绑 对 象 ? 一 一 与 A 商品 关联 销售 规则 较 强 的 商品 是 C、 瑟 或 G 商 品 ， 这 些 商 品 搭配 销售 预期 提升 300 万 元 。 


` 网 站 需要 新 增 广告 位 以 满足 越 来 越 多 商家 的 广告 需求 ， 应 该 在 哪些 位 置 新 增 广告 位 ? 一 一 首页 右 侧 区 域 用 户 的 点 击 率 较 高 ， 该 位 置 可 考虑 开辟 为 新 的 广告 位 。 
通过 以 上 规则 明确 了 业务 所 要 行动 的 细节 要 素 ， 是 一 种 具有 极 高 落地 价值 的 数据 分 析 工 作 。 
2. 模 糊 的 业务 执行 规则 


模糊 的 业务 执行 规则 指数 据 分 析 结 果 未 提供 详细 的 动作 因素 ， 仅 指明 了 下 一 步行 动 方向 或 目标 。 这 类 场景 常见 的 应 用 如 下 : 


. 菜 商品 EE 页 面 流 量 来 源 中 ， 站 内 流量 来 源太 少 ， 现 要 提高 站 内 流量 入 口 如 何 实现 ? 站 内 主要 流量 页 面 是 A、B 或 C， 建 议 从 A、B 或 C 三 个 最 大 流量 的 页 面 入 手 。 


. 今日 大 型 促销 活动 中 ， 不 少 线 下 商贩 也 加 入 到 普通 消费 者 的 队伍 中 抢购 商品 ， 这 些 商贩 都 是 哪些 人 ? -根据 数据 挖 据 结 果 提 供 了 类 似 商贩 的 异常 会 员 ID， 需 要 业务 方 进一步 核实 。 
8.4.3 ”提取 业务 执行 建议 的 常用 方法 


提取 业务 执行 建议 的 常用 方法 包括 热力 图 分 析 、 路 径 分 析 、 关 联 模型 、 决 策 树 模型 、 异 常 值 处 理 等 。 


域 ， 具 有 重要 的 参考 价值 。 
热力 图 分 析 常 用 于 提取 单 页 面 内 重要 的 访问 特征 ， 如 点 击 集中 度 、 功 能 使 用 率 等 情况 ， 通 过 发 现 用 户 集中 点 击 区 域 为 业务 行动 指明 方向 。 


举例 : 假设 要 在 首页 新 增 广 告 位 ， 通 过 像素 热力 图 分 析 发 现 ， 首 页 右 侧 “ 游 戏 充值 ”位 置 点 击 集中 明显 ， 其 中 充值 下 拉 框 点 击 热度 非常 高 。 除 此 之 外 ， 位 于 下 拉 框 的 右 侧 存在 大 量 的 用 户 点 击 ， 说 明 用 
户 所 在 位 置 的 点 击 集中 度 非常 高 。 


i 


| 


图 8-16 ”点 击 热 力图 分 析 
2. 路 径 分 析 
路 径 分 析 最 常 使 用 的 业务 执行 场景 是 为 站 内 流程 优化 、 流 量 引 导 和 分 配 等 提供 决策 建议 的 。 


举例 : 站 内 页 面 引 流 是 网 站 内 部 流量 分 配 和 优化 的 重要 步骤 ， 现 要 针对 某 页 面 进行 引流 分 析 以 提炼 出 从 哪些 页 面 可 以 带 来 更 多 的 内 部 流量 。 图 8-17 所 示 的 页 面 
(http://www.searchmarketingart.com) 的 内 部 流量 来 源 分 散 ， 流 量 引 入 较 多 的 内 部 页 面 是 一 个 文章 页 ， 其 次 是 标签 页 、 关 于 作者 、 一 个 文章 页 和 分 类 目录 页 ， 其 他 占 45% 的 流量 分 散在 各 个 页 面 中 。 假 
设 现 在 网 站 存在 一 个 流量 较 大 的 页 面 M，M 对 目标 页 面 是 没有 引流 贡献 的 。 因 此 ， 可 以 考虑 在 M 页 面 规划 相关 的 广告 位 、 文 章 推荐 、 关 键 字 链接 等 ， 以 便 增 加 对 目标 页 面 的 引流 效果 。 
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图 8-17 ”站 内 流量 路 径 图 分 析 
同样 ， 我 们 可 以 将 该 页 面 作为 原始 分 流 页 面 ， 分 析 该 页 面 对 其 他 页 面 的 流量 贡献 ， 该 方法 常用 于 具有 分 流 功能 的 页 面 ， 如 活动 主页 面 、 导 航 页 面 、 首 页 、 分 类 展示 页 面 等 。 
3. 天 联 模 型 
关联 模型 在 本 书 的 很 多 章节 都 讲 过 ， 由 于 其 可 以 直接 提取 出 业务 规则 ， 因 此 是 最 适合 做 业务 行动 建议 的 数据 分 析 方 法 之 一 。 
关联 模型 广泛 应 用 于 购物 篮 分 析 、 站 内 页 面 浏览 分 析 、 站 外 渠道 来 源 分 析 、 关 键 字 搜索 分 析 、 产 品 查看 分 析 等 ， 回 答 的 问题 类 似 于 发 生 了 A 之 后 ， 会 发 生 B 还 是 C?” 或 者 通常 是 A 和 B， 还 是 A 和 C 一 起 发 
生 ? 


举例 : 现 已 Clementine12 自 带 模型 流 举 例 ， 模 型 位 于 安装 程序 的 \Demos\Association_Module 下 ， 流 名 称 为 basklinks_Association。 打 开 该 模型 之 后 ， 进 行 以 下 两 步 优 化 。 


一 是 新 增 过 渡 节 点 ， 以 便 将 原始 数据 文件 的 英文 名 称 翻译 成 中 文 ， 具 体 做 法 是 : 从 底部 收藏 夹 中 拖 出 “过 滤 ” 节 点 到 建 模 流 中 ， 然 后 将 该 节点 加 到 BASKETS1n 和 type 节 点 中 。 双 击 打开 过 滤 节 点 ， 将 左 
侧 的 英文 名 翻译 为 中 文 名 并 录入 到 右 侧 过 滤 后 的 字段 中 ， 如 图 8-18 所 示 。 


二 是 加 入 该 节点 后 ，type 节 点 需要 打开 并 重新 “ 读 取 值 ”。 同 时 ， 网 络 中 的 输出 字段 也 需要 同步 删除 原来 的 英文 ， 新 增 修改 后 的 中 文字 段 。 


完成 以 上 调整 后 ， 运 行 网 络 节点 (“12 字段 ”节点 ) ， 即 可 出 现 基 于 关联 销售 的 数据 结果 ， 调 节 底 部 滑 块 可 显示 不 同 关 联 程度 下 的 链接 数据 。 从 图 8-19 中 可 以 看 出 蔬菜 缸 头 、 啤 酒 和 冷冻 餐 肉 的 购买 关 
联 性 较 强 ， 同 时 水 果蔬 菜 和 鱼 的 天 联 购买 特征 也 比较 强 。 
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图 8-19 ”关联 模型 网 络 结果 图 


运行 其 他 关联 模型 ， 然 后 将 右上 角 的 运行 结果 拖 入 中 央 区 域 ， 任 意 打开 其 中 的 一 个 关联 模型 结果 。 图 8-20 为 Apriori 关 联 模型 结果 ， 单 击 町 贡 按钮 ， 将 实例 数 选中 并 显示 ; 然后 单 击 [可 按钮， 按 左 侧 
排序 指标 进行 排序 (默认 为 按 置信 度 排序 ) 。 


LS 


芝 持 友 名 站 信和 孤 各 


六 时 ; 50.174 
日 酒 : 52.174 
啤酒 这 守 横 头 55.116 
啤酒 网 56.291 
E 计 只 尖 啤酒 56.997 
人 闲 稚 内 苇 茜 忽 半 , 57.096 
收 苇 并 头 入 东 回 内 57.285 
仿 所 长 内 啤酒 58.02 
啤酒 仿 闵 窗 肉 \ ee 
咏 荣 更 尖 啤酒 85.982 
今 闵 办 向 
念头 钨 向 87 425 


图 8-20 Aptioti 关 联 模 型 结果 


Apriori 关 联 模 型 数据 显示 ， 购 买 了 蔬菜 镀 头 (前 项 ) 同时 购买 了 冷冻 餐 肉 (后 项 ) 的 用 户 最 多 ， 这 种 情况 (购买 了 蔬菜 缸 头 后 又 购买 了 冷冻 餐 肉 的 帮 生 次 数 ) 的 实例 数 为 303， 支 持 度 为 30.3， 置 信和 度 
为 57.096。 由 此 得 到 关联 规则 ， 如 果 要 针对 冷冻 餐 肉 进行 促销 ， 可 捆绑 的 商品 优先 是 蔬菜 罐头 ， 其 次 是 啤酒 ， 或 者 将 啤酒 和 蔬菜 罐头 打包 。 


4. 决 策 树 模型 
决策 树 模型 也 是 典型 的 可 应 用 到 执行 建议 中 的 一 类 分 析 方 法 。 该 模型 中 的 结果 包含 执行 规划、 执行 样本 量 、 预 期 执行 后 的 效果 等 业务 必 备 要 素 。 
上 述 关 联 模 型 从 “商品 ”的 角度 提取 了 业务 行动 的 规则 ， 现 在 使 用 决策 树 模型 人 “人 ”的 角度 提取 规则 ， 即 要 实现 特定 的 营销 目标 ， 应 该 针对 哪些 人 开展 行动 。 


举例 : 以 Clementine12 自 带 的 演示 模型 为 例 ， 使 用 \Demos\Classification_Module 目 录 下 的 baskrule 流 。 为 了 便于 理解 并 有 针对 性 地 开展 工作 ， 现 只 需要 选择 同时 购买 fruitveg 和 fish 的 用 户 样 本 ， 以 
便 针 对 同时 购买 这 两 种 产品 的 用 户 做 曹 销 方案 ， 具 体 优化 步骤 如 下 : 


步骤 一 : 新 增 一 个 type 节 点 与 流 中 的 healthy 连 接 。 
步骤 二 : 双击 打开 type 节 点 ， 并 将 其 中 的 value、pmethod、sex、homeown、income、age 设 置 为 输入 节点 ， 将 healthy 设 置 为 输出 节点 。 


步骤 三 : 新 增 C5.0 挖 掘 模型 并 连接 到 type 节 点 ， 如 图 8-21 所 示 。 
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图 8-21 决策 树 模 型 新 增 节点 设置 
步骤 四 : 打开 新 增 的 C5.0 挖 握 节 点 ， 为 了 更 好 地 对 比 图 形 和 结果 并 获得 更 多 信息 ， 将 “输出 类 型 ”分 别 设置 为 “决策 树 ” 和 “规则 集 ” 并 点 击 执行 。 
@ie 示 在 大 多 数 场 景 下 ， 建 议 将 输出 类 型 设置 为 “决策 树 ”， 决 策 树 的 输出 结果 除了 使 用 图 形 化 展现 结果 外 ， 还 能 提供 规则 集中 的 规则 ， 包 含 响 应 率 、 样 本 量 等 更 多 指标 。 


步骤 五 : 将 右上 角 挖 掘 后 的 结果 分 别 拖 入 面板 中 并 分 别 双 击 打开 并 可 以 看 到 挖掘 规则 ， 如 图 8-22 所 示 ， 左 侧 为 规则 集结 果 ， 显 示 了 结果 为 真 (T) 情况 下 的 用 户 特征 是 hometown=NO 且 age<24; 右 
侧 为 决策 树 输出 ， 从 图 形 中 按照 节点 解读 为 : 当 age<24 时 ， 用 户 结果 为 真 的 数量 为 112， 响 应 比例 为 40.433%; 在 该 特征 基础 上 做 进一步 细 分 ， 当 hometown=No 时 ， 用 户 结果 为 真 的 数量 为 110， 响 应 比 
例 为 80.292%。 决 策 树 的 规则 与 规则 集 一 致 县 提供 了 更 多 可 供 参 考 的 指标 。 
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图 8-22 ”决策 树 模 型 解读 
5. 异 常 值 处 理 
异常 值 处 理 是 面 对 海 量 数据 时 ， 提 取 具 有 异常 特征 数据 的 重要 方法 ， 常 用 于 异常 订单 识别 、 风 险 客 户 预 警 、 黄 牛 识别 、 贷 款 风 险 识别 、 欺 诈 检 测 、 技 术 入 侵 等 针对 个 体 的 分 析 场 景 。 
举例 : 以 Clementine12 自 带 的 演示 模型 为 例 ， 使 用 DemosNClassification_Module 目 录 下 的 fraud_anomalies 流 。 为 了 更 好 的 贴近 实际 应 用 ， 现 对 原 模 型 进行 以 下 调整 。 
步骤 一 : 设置 “异常 检测 一 模型 ”中 的 “确定 判断 异常 的 截断 值 基于 ” 值 为 “训练 数据 中 最 异常 的 记录 百分比 ”一 一 大 多 数 情况 下 按 比例 筛选 是 最 优 做 法 ， 如 只 筛选 整个 样本 中 的 5% 作 为 异常 样本 。 
步骤 二 : 设置 完 异 常 检测 节点 之 后 点 击 运行 ， 并 将 得 到 的 最 新 模型 结果 代 著 原来 的 模型 结果 (图 中 黄色 节点 ) 加 入 模型 流 中 。 
步骤 三 : 设置 图 形 展示 节点 中 的 “动画 ”与 X 轴 字段 一 致 ， 目 的 是 从 不 同 区 间 查 看 分 类 异常 值 的 情况 ， 整 个 流 模型 ， 如 图 8-23 所 示 。 


步骤 四 : 数据 解读 。 图 形 中 展示 的 只 是 二 维 状 态 下 的 数据 ， 即 由 X 轴 和 Y 轴 两 个 变量 组 成 的 异常 检测 图 ， 实 际 上 在 模型 中 有 region、farmsize、rainfall、landquality、farmincome、maincrop、 
claimtype、claimvalue 共 8 个 字段 ， 这 8 个 字段 的 数据 无 法 通过 二 维 图 形 完全 展示 出 来 。 图 8-24 所 示 为 将 farmsize 作 为 X 轴 、rainfall 作 为 Y 轴 的 图 形 ， 同 时 通过 “动画 ”节点 可 和 直接 拖 暇 分 析 不 同 farmsize 范 
围 下 的 异常 数据 ， 该 数据 通过 流 中 的 Table 节 点 可 直接 输出 并 获得 检测 到 的 存在 异常 的 用 户 ID。 
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图 8-24 异常 检测 图 形 


人 @@ 记 示 “异常 检测 结果 并 不 意味 着 被 检测 出 来 的 数据 一 定 是 异常 的 ， 它 只 是 根据 数据 的 特点 提供 了 可 能 存在 异常 的 数据 集 ， 这 些 异 常 的 数据 集 需要 业务 方 进一步 验证 。 


8.5 ”正确 的 数据 异型 与 算法 选择 观 


在 数据 分 析 和 挖掘 的 实际 工作 中 ， 实 现 同一 个 数据 目标 会 有 多 种 工具 、 多 种 模型 和 多 种 算法 可 供 选择 ， 在 选择 时 要 兼顾 数据 准确 性 导向 、 数 据 工 作 效 率 性 导向 和 数据 落地 应 用 性 导向 。 


1 .数据 准确 性 导向 
数据 准确 性 导向 指 无 论 采 用 哪 种 工具 、 模 型 或 算法 ， 都 必须 保证 数据 方向 正确 以 及 数据 误差 最 小 化 。 提 供 准 确 的 数据 结果 和 数据 洞察 是 数据 从 业者 的 工作 前 提 ， 在 同等 条 件 下 ， 更 准确 的 数据 工具 、 模 


型 或 算法 会 是 更 优选 择 。 
2. 数 据 工 作 效 率 性 导向 


数据 工作 效率 性 导向 指 开展 数据 工作 时 应 该 选择 工作 效率 最 高 、 输 出 时 间 最 短 的 解决 方案 。 工 作 效率 是 数据 工作 产 出 和 数据 价值 的 必要 保证 ， 假 如 分 析 师 在 一 个 课题 中 需要 耗费 大 量 时 间 才 能 输出 结 
果 ， 即 使 结果 是 完全 正确 的 (很 多 时 候 无 法 保证 结果 的 正确 性 ) ， 也 可 能 会 没有 太 大 的 实际 价值 ， 原 因 可 能 如 下 : 


: 业务 方 已 经 通过 其 他 方法 解决 该 问题 。 


“ 业务 方 已 经 面临 新 的 、 更 重要 的 问题 ， 对 之 前 的 问题 关注 度 不 大 。 


* 数据 结果 基于 “过 时 ”的 数据 产生 ， 对 现在 的 工作 没有 太 大 的 参考 价值 。 


工作 效率 性 导向 要 求 在 同等 条 件 下 ， 数 据 从 业者 在 选择 数据 工具 、 模 型 和 算法 时 根据 自身 经 验 、 技 术 能 力 、 业 务 知识 及 所 要 使 用 的 时 间 ， 找 到 效率 最 高 、 用 时 最 短 的 解决 方案 。 
3. 数 据 落 地 应 用 性 导向 
数据 落地 应 用 性 导向 指 选 择 数据 工具 、 模 型 和 算法 时 需要 结合 应 用 对 象 的 实际 情况 。 


如 果 数 据 应 用 对 象 是 业务 部 门 ， 就 需要 数据 结果 和 产 出 能 很 好 地 被 业务 部 门 理解 ， 在 理解 的 基础 上 才 可 能 产生 业务 落地 。 因 此 ， 在 数据 挖掘 算法 中 ， 面 向 业务 人 员 聚 类 、 关 联 、 决 策 树 、 时 间 序 列 、 线 
性 回归 等 算法 会 更 优 于 神经 网 络 、COX、SVM、 贝 叶 斯 、Genlin 等 算法 。 


在 面向 机 器 或 数据 应 用 产品 的 选择 中 ， 要 结合 目标 对 象 的 应 用 能 力 和 开发 能 力 、 原 始 数 据 集 特点 、 工 具 本 身 的 优 劣 势 、 数 据 运算 量 和 运算 速度 、 结 果 调用 时 间 和 需求 频率 、 企 业 软 硬 件 支持 水 平等 进行 
综合 评估 


总 之 ， 由 于 企业 面临 的 实际 情况 不 同 ， 不 存在 适合 所 有 公司 和 场景 的 数据 准确 性 最 好 、 工 作 效率 最 高 、 落 地 应 用 性 最 好 的 工具 、 模 型 或 算法 。 数 据 从 业 人 员 需 要 根据 实际 情况 选择 最 适合 企业 需求 的 工 
具 、 模 型 和 算法 ， 并 兼顾 数据 准确 性 、 效 率 性 和 应 用 性 原则 。 


8.6 本章 小 结 


本 章 曾 述 的 核心 内 容 是 如 何 将 数据 应 用 到 企业 业务 工作 的 不 同 阶段 ， 本 章 重点 需要 读者 掌握 的 知识 点 如 下 : 

" 数据 发 挥 价值 的 四 个 阶段 ， 重 点 是 数据 预测 和 数据 业务 执行 阶段 ; 

* 每 个 阶段 所 使 用 的 数据 分 析 方 法 和 挖掘 模型 ，Excel、SPSS 和 Clementine 都 是 必 备 的 工具 ; 

正确 的 数据 工具 、 模 型 和 算法 选择 观 ， 会 让 读者 的 数据 工作 更 有 效率 且 更 有 价值 。 

在 所 有 的 数据 分 析 和 挖掘 方法 中 ， 工 具 、 算 法 和 模型 是 固定 的 ， 但 业务 场景 是 灵活 多 变 的 ， 同 一 种 数据 分 析 可 以 应 用 到 不 同 的 场景 下 ， 天 键 看 数据 从 业者 对 数据 的 理解 和 业务 结合 能 力 。 


限于 篇 幅 ， 不 同 场 景 下 的 每 种 算法 只 介绍 了 一 种 ， 建 议 读者 自行 安装 PASW Statistics 和 Clementine， 结 合 其 自 带 的 演示 案例 进行 自我 学 习 。 同 时 ， 对 于 任何 一 种 数据 分 析 工 具 和 模型 ， 数 据 特 点 和 数 
据 量 的 差异 会 直接 影响 数据 应 用 实践 ， 因 此 建议 读者 结合 企业 实际 情况 进行 海量 数据 、 多 种 业务 场景 下 的 应 用 实践 ， 这 样 才能 把 数据 应 用 能 力 提升 得 更 高 。 


案例 扁 


. 第 9 章 ”网 站 数据 的 营销 辅助 应 用 
第 10 章 ”数据 驱动 下 的 数字 营销 应 用 
` 第 11 章 ”网 站 数据 的 运营 辅助 应 用 


. 第 12 章 ”数据 驱动 下 的 个 性 化 运营 应 用 


第 9 章 ”网 站 数据 的 营销 辅助 应 用 


通过 对 前 几 章 关于 数据 分 析 方 法 论 的 学 习 ， 相 信 各 位 读者 已 经 掌握 了 相对 丰富 的 知识 体系 ， 但 仅 有 知识 还 远 远 不 够 ， 学 以 致 用 才 是 学 习 的 根本 落脚 点 。 


从 本 章 开始 ， 我 们 将 一 起 进入 实践 应 用 阶段 。 本 章 将 围绕 网 站 分 析 的 重点 课题 一 营销 辅助 决策 与 应 用 进行 讲解 ， 包 括 网 站 营销 分 析 辅 助 决策 报告 矩阵 、 三 种 常用 的 网 站 营销 分 析 场 景 、 常 用 的 网 站 和 曹 
销 分 析 维 度 和 网 站 营销 辅助 决策 四 大 案例 。 通 过 学 习 ， 读 者 将 具备 较为 完善 的 营销 辅助 决策 思路 和 较 强 的 营销 分 析 能 力 ;， 同时， 本 章 中 的 案例 可 直接 应 用 到 企业 实践 中 ， 以 帮助 读者 快速 输出 知识 价值 和 数 
据 分 析 成 果 。 


9.1 ”网 站 营销 分 析 辅 助 决策 报告 矩阵 
无 论 是 通过 系统 开发 的 自动 报表 还 是 手工 挖掘 并 撰写 的 报告 ， 都 属于 辅助 决策 的 范畴 。 网 站 营销 分 析 辅 助 报告 矩阵 按照 触发 情况 和 频率 可 分 为 临时 分 析 、 实 时 分 析 、 日 常 报表 、 专 题 分 析 和 项 目 分 析 。 
1.I 临 时 分 析 
(1) 临时 分 析 的 含义 
临时 分 析 是 为 了 满足 营销 业务 的 需要 而 临时 增加 的 需求 ， 包 括 数 据 提取 、 数 据 咨 询 、 数 据 报告 等 。 临 时 分 析 是 日 常 工作 中 的 一 部 分 ， 是 区 别 于 既定 计划 工作 的 突 发 性 和 临时 性 工作 。 
(2) 临时 需求 的 来 源 
临时 分 析 的 需求 对 象 包 括 上 级 领导 部 门 的 临时 需求 、 平 行 部 门 的 临时 需求 及 数据 中 心 内 部 的 临时 需求 。 
. 上 级 领导 部 门 的 临时 需求 是 临时 分 析 的 主要 来 源 ， 由 于 无 法 预知 且 无 法 拒绝 ， 因 此 是 临时 分 析 的 重点 工作 。 此 类 需求 涉及 范围 较 广 ， 可 能 包括 全 站 和 特定 对 象 的 数据 需求 、 特 定 业 务 的 效果 分 析 等 。 
. 平行 部 门 的 临时 需求 ， 指 需求 部 门 与 数据 中 心 或 部 门 处 于 平行 关系 ， 其 需求 基于 特定 主题 或 结果 的 临时 工作 。 此 类 需求 是 日 常 琐碎 需求 的 主要 构成 部 分 ， 应 该 通过 流程 化 的 机 制 来 规范 。 


` 数据 中 心 内 部 的 临时 需求 指 需求 来 源 于 数据 工作 体系 内 部 ， 通 常见 于 初级 分 析 师 的 日 常 工作 中 ; 内 部 的 临时 数据 需求 通常 是 为 了 满足 高 级 分 析 师 的 特定 分 析 需 求 ， 是 内 部 分 工 协作 的 一 部 分 。 


(3) 正确 处 理 临 时 需求 
过 多 的 临时 需求 会 干扰 正常 工作 的 开展 ， 同 时 会 扰乱 整个 数据 分 析 体 系 的 价值 输出 ， 因 此 需要 正确 处 理 临 时 需求 与 正常 工作 的 关系 。 

. 处 理 原则 。 对 待 临时 需求 ， 既 要 兼顾 临时 需求 的 紧 连 性 和 重要 性 ， 又 要 保证 日 常 工作 的 正常 开展 ,但 不 可 把 过 多 的 时 间 浪 费 在 临时 需求 处 理 中 。 

“ 处 理 方法 。 对 于 临时 需求 中 的 规律 性 工作 ， 可 合并 到 日 常 工作 中 ; 对 于 其 中 必须 处 理 的 部 分 ， 可 根据 其 时 间 要 求 与 工作 量 安排 输出 周期 ; 而 对 于 没有 必要 处 理 的 需求 要 坚决 予以 驳回 。 
i 临时 需求 分 三 种 类 型 : 必须 且 紧 急 、 必 须 但 不 紧急 和 不 必 处 理 。 前 两 类 工作 是 临时 需求 需要 处 理 的 工作 ， 而 第 三 类 可 通过 有 针对 性 的 培训 和 指导 、 开 放 数 据 权 限 等 方法 “ 授 之 以 渔 ”。 
实时 分 析 是 营销 辅助 决策 的 重要 组 成 部 分 ， 也 是 数据 发 挥 价 值 的 重要 输出 窗口 。 实 时 分 析 常 见于 企业 大 型 营销 活动 开展 的 过 程 中 ， 通 过 实时 监测 和 反馈 信息 以 辅助 业务 进行 实时 优化 的 场景 。 

(1) 实时 分 析 发 挥 作用 的 原则 
实时 分 析 不 是 针对 所 有 场景 都 能 发 挥 作用 的 ， 而 是 有 特定 作用 范围 和 要 求 。 


可 监测 的 业务 效果 。 实 时 分 析 发 挥 作 用 的 前 提 之 一 是 有 数据 支持 ， 这 要 求 数据 既 要 可 控 于 企业 内 部 又 要 可 测量 。 例 如 ， 企 业 在 电视 媒体 上 投放 的 广告 由 于 不 可 测量 而 无 法 提供 实时 数据 支持 ; 企业 在 
视频 网 站 上 投放 品牌 类 广告 ， 如 果 没 有 可 供 监 测 的 播放 时 长 、 播 放 率 等 数据 ， 也 无 法 提供 实时 数据 支持 。 


. 可 实时 反馈 的 数据 。 实 时 分 析 的 第 二 个 关键 点 是 数据 可 以 实时 更 新 ， 实 时 数据 支持 的 基础 频率 是 分 钟 和 秒 ， 在 某 些 场景 下 采用 按 小 时 或 天 更 新 的 频率 无 法 满足 实时 分 析 需 求 。 
. 可 优化 的 业务 节点 。 可 优化 是 实时 分 析 的 输出 关键 ， 这 意味 着 实时 分 析 的 结果 输出 后 ， 业 务 方 可 有 针对 性 的 改善 和 优化 ; 如 果实 时 监测 的 业务 无 法 进行 优化 操作 ， 那 么 实时 分 析 的 价值 将 大 打折 扣 。 
(2) 实时 分 析 发 挥 作 用 的 方式 
实时 分 析 由 于 对 数据 的 实时 性 要 求 极 高 ， 因 此 不 会 采用 非常 复杂 的 算法 以 及 企业 海量 数据 进行 运算 ， 其 发 挥 作 用 的 方式 主要 是 侧重 于 实时 数据 统计 和 基于 简单 算法 的 异常 检测 。 


方式 一 : 实时 数据 统计 。 实 时 数据 统计 是 基础 的 数据 输出 功能 ， 根 据 时 间 跨 度 可 输出 一 定时 间 内 的 数据 。 图 9-1 所 示 为 Webtrekk 提 供 的 实时 数据 功能 ， 数 据 每 10 秒 更 新 一 次 ， 数 据 跨度 为 当天 并 提供 了 
与 上 周 同期 的 数据 对 比 。 
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图 9-1 Webtrekk 实 时 数据 统计 分 析 


方式 二 : 异常 数据 监测 。 异 常数 据 监测 是 实时 数据 分 析 的 核心 ， 其 价值 在 于 可 以 针对 实时 数据 提炼 异常 情况 ， 并 提示 相关 业务 引起 注意 。 异 常数 据 监测 的 常用 营销 点 包括 异常 流量 监测 、 异 常 订单 监 
测 、 异 常 页 面 访问 等 。 图 9-2 所 示 为 在 选择 的 数据 区 间 内 ， 存 在 6 个 异常 数据 点 ， 数 据点 高 于 预期 值 ， 且 不 同 异常 点 的 异常 增高 情况 不 同 (具体 可 查看 异常 值 ) 。 
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图 9-2 ”异常 数据 监测 
(3) 实时 分 析 发 挥 作用 的 落地 


实时 分 析 并 不 是 针对 所 有 渠道 都 能 发 挥 作用 的 ， 某 些 渠 道 的 固定 性 质 决定 了 其 不 存在 实时 分 析 的 落地 价值 。 


* 国定 投放 类 渠道 。 国 定投 放 类 渠道 包括 包 段 投放 的 广告 、 固 定购 买 的 网 址 导航 、 商 务 合作 的 友情 链接 、SEM 品 牌 区 等 ， 这 些 渠 道 的 特点 是 购买 或 合作 的 媒介 类 型 已 经 固定， 缺乏 优化 空间 。 比 如 针对 
网 址 导航 的 媒介 购买 ， 通 常 是 季度 投放 ， 即 使 通过 实时 数据 发 现 一 天 中 某 个 时 间 点 存在 可 优化 价值 ， 由 于 受 其 推广 形式 〈 通 常 是 网 站 文字 名 称 ) 和 合作 周期 (固定 一 个 季度 ) 的 限制 ， 实 时 分 析 无 法 落地 。 


资源 紧俏 类 渠道 。 虽 然 当前 可 供 选择 的 广告 媒介 数量 非常 多 ， 但 流量 高 、 效 果 好 的 媒介 仍然 集中 于 少数 媒介 ， 如 网 址 导航 广告 、 百 度 关键 字 、 门 户 首页 和 特定 频道 页 、 客 户 端 弹 窗 等 。 在 这 种 背景 
下 ， 业 务 团队 执行 的 第 一 要 素 仍 然 是 抢夺 投放 资源 和 排 期 ， 因 此 即使 出 现 可 供 实时 支持 的 辅助 决策 ， 也 会 由 于 缺乏 优化 资源 的 支持 而 无 法 实 


3. 日 常 报告 


(1) 日 常 报告 的 分 类 


日 常 报告 按 频 率 和 数据 时 间 范 围 可 分 为 小 时 报 (重大 业务 动作 下 ， 如 店庆 、 周 年 庆 ) 、 日 报 、 周 报 、 季 报 、 半 年 报 和 年 报 。 
(2) 日 常 报告 的 特点 
日 常 报告 的 特点 是 针对 一 定 周期 的 数据 进行 汇总 和 统计 ， 以 便 获 得 关于 整体 和 细 分 数据 的 趋势 和 变化 。 日 常 报告 通常 采用 相同 的 输出 框架 和 模板 ， 因 此 呈现 出 程式 化 、 常 规 化 和 周期 性 的 特点 。 
a 日 常 报 告 的 作用 是 数据 汇总 和 趋势 把 控 ， 并 通过 数据 得 出 下 一 步 的 行动 方向 ， 不 建议 在 日 常 报告 中 加 入 大 篇 幅 的 分 析 ， 专 项 分 析 过 程 应 该 在 单独 的 专题 分 析 中 体现 。 
(3) 日 常 报告 的 核心 关注 点 
日 常 报告 的 内 容 需 要 在 常规 化 的 前 提 下 做 出 特色 ， 内 容 是 最 重要 的 一 个 方面 ， 以 下 是 针对 日 常 报告 中 涉及 内 容 的 三 个 建议 。 


* 关注 整体 趋势 。 周 期 性 报告 一 定 要 有 关于 整体 趋势 的 定论 ， 对 比 、 环 比 、 定 基 比 都 是 比较 好 的 趋势 观察 方法 ， 关 于 整体 趋势 的 变化 结论 除了 描述 涨 落 以 外 ， 还 需要 确定 涨 落 异 常 。 另 外 ， 确 定 标杆 值 


也 是 日 常数 据 描述 的 重要 途径 和 参照 点 。 
. 关注 重要 事件 。 报 告 中 期 内 的 重要 事件 是 汇报 对 象 普遍 关注 的 模块 ， 因 此 有 必要 将 重要 事件 的 数据 及 对 整体 的 影响 做 简要 分 析 。 
. 关注 潜在 因素 。 除 了 整体 数据 外 ， 作 为 数据 分 析 师 一 定 要 能 通过 数据 发 现 报告 周期 内 的 潜在 因素 ， 该 因素 可 能 是 与 整体 趋势 相近 或 相反 的 ， 但 对 整体 可 能 会 产生 重要 影响 的 业务 节点 。 
人 注意“ 灯 些 教 据 从 业者 单纯 发 送 数据 表格 的 工作 并 不 算 报 告 ， 这 些 工作 应 该 尽量 通过 系统 自动 实现 ; 报告 一 定 是 有 事实 、 有 观点 、 有 结论 的 主体 ， 而 不 是 一 个 数据 陈列 。 
4. 专 题 分 析 


专题 分 析 的 作用 对 象 是 营销 中 心 或 营销 部 门 ， 围 绕 特 定 专题 或 观点 进行 数据 专项 挖掘 或 分 析 。 专 题 报 告 区 别 于 日 常 报告 的 一 个 重要 特点 是 ， 专 题 报告 围绕 某 个 特定 领域 展开 的 小 而 精 的 深入 研究 ， 而 日 
党 报告 侧重 于 某 个 周期 大 而 全 的 概要 分 析 。 


(1) 专题 报告 的 分 类 


专题 报告 要 按 业务 模块 进行 划分 ， 包 括 广 告 类 专题 分 析 、SEM 专 题 分 析 、 新 媒体 专题 分 析 、 商 务 合作 专题 分 析 、SEO 专 题 分 析 、 会 员 营销 专题 分 析 和 CPS 专 题 分 析 等 。 同 时 ， 每 个 业务 模块 都 需要 按 周 
期 进行 划分 ， 包 括 月 度 专题 报告 、 季 度 专题 报告 、 年 度 专题 报告 等 。 


(2) 专题 报告 的 结构 
专题 报告 的 标准 结构 通常 包括 以 下 几 个 部 分 : 
: 封皮 和 封底 。 每 个 公司 都 有 自己 的 封皮 和 封底 模板 。 
“ 摘要 页 。 摘 要 页 是 对 报告 中 内 容 的 概述 ， 方 便 领 导 层 通过 阅读 摘要 直接 了 解 报 告 内 容 而 无 须 阅读 整个 报告 (事实 上 ， 大 多 数 领导 都 只 看 摘要 ) 。 
“ 目录 页 。 如 果 报告 内 容 过 多 ， 则 需要 通过 目录 告诉 阅读 者 包括 哪些 内 容 。 
.说明 页 。 关 于 报告 中 数据 时 间 、 数 据 粒 度 、 数 据 维度 、 数 据 定 义 、 数 据 计 算 方法 和 相关 模型 等 内 容 的 特殊 说 明 ， 目 的 是 增强 报告 的 可 理解 性 。 
. 正文 页 。 正 文 页 是 报告 的 核心 ， 通 常 使 用 总 一 分 一 总 的 思路 撰写 报告 。 作 为 日 常 报 告 ， 除 了 数据 陈列 外 ， 一 定 要 有 数据 结论 ; 而 对 于 数据 结论 的 挖掘 ， 可 根据 阅读 者 的 需求 自行 安排 并 酌情 添加 。 
附录。 如 果 报 告 存在 外 部 数据 引用 、 原 始 数据 、 数 据 模 型 解释 等 ， 建 议 作为 附录 增 放 在 报告 最 后 。 
(3) 专题 报告 的 迭代 
专题 报告 由 于 存在 生命 周期 ， 因 此 需要 不 断 更 新 迭代 。 在 迭代 过 程 中 ， 其 又 分 为 针对 已 知 知识 的 迭代 和 针对 未 知 知识 的 探 完 两 部 分 。 


图 9-3 所 示 为 在 周期 一 到 周三 分 别针 对 专题 A、 专 题 B、 专 题 C 进 行 研究 。 从 第 二 个 周期 开始 ， 为 了 更 新 已 知 知识 ， 针 对 专题 A~C 进 行 重复 研究 ; 与 此 同时 ， 又 新 增 了 专题 D~F 的 新 知识 研究 。 以 此 类 


推 ， 每 个 周期 内 都 是 反复 迭代 的 过 程 。 


了 


| 
于 
周期 一 周期 二 ”周期 三 ”周期 四 “周期 五 “周期 六 “周期 七 “周期 八 ”周期 九 
图 9-3 ”和 迭代 的 专题 研究 进程 
为 什么 已 知 知识 需要 迭代 更 新 ”每 个 专题 结论 都 有 产生 的 客观 条 件 ， 当 客观 条 件 发 生变 化 时 ，“ 彼 时 ”的 结论 并 不 一 定 适 合 “ 此 时 ”的 客观 条 件 。 主 要 影响 因素 如 下 : 
. 上 一 次 的 专题 分 析 基 于 过 于 “久远 ” (如 一 年 前 ) 的 数据 ; 
" 业务 出 现 了 新 的 执行 或 操作 要 素 ; 
. 业务 面临 的 核心 目标 发 生变 化 ; 
. 产生 了 新 的 解决 以 往 业 务 问题 的 方法 或 途径 。 


专题 的 迭代 和 更 新 时 间 根 据 已 有 数据 周期 及 业务 场景 的 变化 频繁 度 而 定 。 在 通常 情况 下 ， 至 少 每 半年 需要 更 新 或 验证 一 次 已 知 知识 ， 而 对 于 发 展 迅速 的 业务 可 能 需要 季度 甚至 月 度 维护 。 


随 着 时 间 的 推移 ， 数 据 工作 者 会 面临 越 来 越 多 的 专题 ， 


总 有 一 天 会 出 现 “ 爆 仓 ” 的 问题 。 解 决 这 一 问题 的 方法 如 下 : 


. 每 个 专题 都 有 自己 的 生命 周期 ， 当 该 专题 已 经 没有 专注 的 必要 时 就 停止 更 新 。 


“ 业务 关注 点 发 生 转 移 时 ， 也 意味 着 该 专题 已 经 不 受 重 视 。 


` 将 已 知 知识 的 处 理 方法 传授 给 业务 对 象 ， 在 减轻 自身 工作 的 同时 又 能 提高 业务 方 的 数据 技能 。 


(4) 专题 报告 输出 的 八 个 建议 


专题 报告 的 输出 即 可 视 化 ， 原 则 是 便于 用 户 对 象 阅读 、 理 解 和 应 用 。 下 面 介绍 能 大 大 提高 报告 输出 价值 的 八 个 建议 : 


3) 合理 使 用 模板 。 


。 完整 的 报告 结构 代表 了 完整 和 严谨 的 数据 工作 习惯 。 


。 除 报告 正文 的 内 容 外 ， 报 告 导航 、 页 码 、 备 注 、 角 标 等 都 是 重要 的 信息 输出 源 。 


通过 模板 或 母 版 统一 全 局 配置 是 个 好 习惯 ,包括 版 面 布局 、 文 字 和 图 片区 域 配 比 、 字 体 、 字 号 、 颜 色 等 (拒绝 使 用 Office 默 认 模板 是 个 不 错 的 选择 ) 。 


4) 善于 留 白 。 为 了 突出 报告 主体 并 产生 良好 的 阅读 视觉 ， 每 一 页 报告 都 需要 适度 留 白 。 
5) 适度 使 用 立体 图 形 。 过 多 使 用 立体 图 形 会 分 散 注意 力 ， 同 时 造成 页 面 视觉 混乱。 
图 9-4 所 示 为 一 页 报告 的 示例 。 

6) 采用 深入 浅 出 的 数据 模型 或 方法 。 在 前 文中 已 经 讲 过 ,便于 业务 理解 的 决策 树 、 线 性 回归 、 相 关 分 析 、 聚 类 等 模型 要 优化 神经 网 络 、 主 成 分 分 析 、SVM 等 挖 扎 算法 。 
7) 提供 言 简 意 凡 的 数据 结论 或 解释 。 直 接 使 用 业务 场景 中 的 常用 词汇 进行 解释 会 更 易于 业务 理解 ， 举 例子 、 打 比方 都 是 非常 实用 的 方法 。 


8) 选择 合适 的 报告 形式 。 图 形 较 多 时 PPT 更 合适 ; 数字 较 多 时 Excel 比 较 好 ; 流程 较 多 时 Visio 更 方便 ; 文字 较 多 时 Word 和 PDF 更 恰当 ; 流程 原型 时 Axure 也 可 以 考虑 ; 发 散 思 维 用 Mindmanager 等 思 


用 户 终 生 价 值 曲 绪 


寺 续 关注 一 一 

客户 的 直接 回报 价值 、 辐 接 回报 价值 ; 
客户 的 生命 周期 阶段 及 回报 周期 ; 
客户 的 当期 价值 ; 

客户 的 剩余 价值 ; 


“生命 周 其 


观察 其 形成 期 稳定 期 袁 退 期 


高 投入 、 无 收益 
关注 投入 周期 


高 投入 、 低 收益 
关注 收益 周期 


高 投入 、 低 收益 


延缓 衰退 时 间 


高 投入 、 高 收益 ” 低 投入 、 高 收益 


关注 投入 ROI ”稳定 客户 高 收益 周期 


党 : 昔 户 表 营 戎 菩 三 产生 扩 带 普 必 人 ， 芷 楷 竹 户 及 人 半 淆 光 “和 红 名 训 ” 
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图 9-4 ”报告 示例 


合 尘 总 在 通常 情况 下 ， 除 了 纯 说 明 性 报告 外 ， 不 建议 报告 中 出 现 大 篇 幅 的 文字 ， 原 因 是 文字 过 多 不 便于 业务 阅读 和 理解 ， 尤 其 是 汇报 给 领导 层 时 图 形 + 关 键 文 字 说 明 是 最 好 的 方式 。 


(1) 项 目 分 析 的 含义 

项 目 分 析 通 常 是 基于 跨 中 心 的 主题 需求 或 基于 整体 营销 需求 而 产生 的 专项 数据 分 析 ， 它 是 更 偏 全 局 性 的 一 类 专题 分 析 工 作 。 
(2) 项 目 分 析 的 分 类 

项 目 分 析 根 据 服务 对 象 通常 可 分 为 两 部 分 。 


一 是 服务 于 营销 高 层 领导 专项 分 析 ， 包 括 营销 中 心 负责 人 及 更 高 级 别 领 导 ， 如 SVP、CMO、CEO、COO 等 。 此 类 主题 通常 是 营销 结构 优化 、 营 销 费 用 预测 、 最 优 营 销 费 用 与 收益 分 析 等 ， 目 的 是 用 来 
辅助 企业 决策 层 做 营销 决策 。 图 9-5 中 的 A 区 域 显 示 了 项 目 分 析 的 上 层 服 务 对 象 。 


二 是 服务 于 公司 其 他 中 心 的 专题 分 析 ， 通 常 是 跨 中 心 级 的 数据 协作 ， 如 针对 公司 级 大 型 促销 活动 的 整体 分 析 ， 除 营销 分 析 外 ， 还 包括 运营 分 析 、 商 品 分 析 、 
客户 服务 分 析 等 。 跨 中 心 的 项 目 分 析 目 的 是 满足 公司 内 部 多 部 门 协作 分 析 需 求 。 图 9-5 中 的 B 区 域 显示 了 项 目 分 析 的 跨 中 心服 务 对 象 ，C 区 域 是 普通 的 专题 分 析 课 题 。 


物流 中 心 


图 9-5 项目 分 析 服 务 对 象 


(3) 项 目 分 析 与 专题 分 析 的 异同 点 

项 目 分 析 和 专题 分 析 都 是 针对 特定 主题 的 深入 研究 ， 且 都 是 通过 数据 分 析 和 数据 挖掘 发 现 潜在 价值 的 辅助 决策 形式 。 但 两 者 在 服务 对 象 、 作 用 范围 和 时 间 人 花费 上 差异 较 大 。 
. 服务 对 象 不 同 。 项 目 分 析 服务 于 公司 领导 层 或 平行 中 心 ; 专题 分 析 服 务 于 营销 体系 内 部 。 

. 作用 范围 不 同 。 项 目 分 析 可 作用 于 企业 其 他 运营 环节 甚至 领导 层 决 策 ; 专题 分 析 作 用 于 营销 内 部 的 执行 层 。 


:时间 花 费 不 同 。 项 目 分 析 因 涉 及 面 广 、 调 用 资源 多 ， 因 此 需要 更 长 的 处 理 周 期 ， 通 常 以 月 为 单位 ; 专题 分 析 由 于 处 于 同一 中 心 内 部 ， 沟 通 和 协作 更 为 方便 ， 因 此 花费 时 间 较 少 ， 通 常 以 周 为 单位 。 


9.2 ”三 种 单 用 的 网 站 写 销 分 析 场 景 


9.2.1 ”营销 前 的 媒体 规划 与 效果 预测 


一 


.营销 预测 的 内 容 

营销 前 的 媒体 规划 与 效果 预测 适用 于 每 个 企业 的 营销 体系 ， 它 通常 分 析 以 下 几 个 方面 的 内 容 : 

" 整体 营销 费用 和 成 本 规划 ， 包 括 总 费用 、 各 细 分 媒介 费用 、 单 次 成 本 管理 (UV 成 本 、 访 问 成 本 、 千 人 成 本 、 每 次 转化 成 本 等 ) 。 

" 整体 和 细 分 媒体 目标 和 KPI 度量 ， 包 括 总 预计 收益 /订单 、 各 细 分 媒介 收益 /订单 、ROI、 转 化 率 〈 目 标 转化 率 、 订 单 转化 率 等 ) 。 

* 整体 营销 策略 和 各 细 分 媒介 策略 ， 包 括 总 营销 任务 、 各 细 分 媒介 任务 、 召 介 选 择 、 媒 介 排 期 、 投 放 侧 重点 、 广 告诉 求 重点 等 。 

2. 营 销 预 测 的 服务 对 象 

营销 前 的 媒介 规划 与 效果 预测 的 服务 对 象 ， 通常 是 营销 部 门 或 中 心 负 责 人 以 及 更 高 级 别 的 领导 层 ， 它 是 典型 的 针对 决策 层 的 服务 项 目 。 
3. 营 销 预 测 的 方法 

有 关 营 销 预 测 的 详细 介绍 ， 请 查阅 8.1 节 的 内 容 ， 在 此 不 再 重复 。 

4. 营 销 预 测 的 注意 点 


(1) 基于 特定 目标 产生 的 营销 


营销 目标 的 预测 不 是 以 媒介 本 身 为 出 发 点 ， 而 是 以 企业 目标 为 出 友 点 ， 典 型 的 企业 目标 包括 品牌 推广 (适合 于 大 型 品牌 商 ) 、 流 量 获 取 (大 部 分 企业 的 实际 需求 ) 、 订 单 获取 (销售 类 企业 的 核心 需 
求 ) 、 转 化 需求 (试用 、 试 驾 、 预 约 等 ) 。 以 下 是 关于 营销 目标 的 举例 。 


示例 一 : 企业 下 个 月 要 做 店庆 活动 ， 预 期 当天 带 来 3000 万 元 的 销售 额 ， 现 需要 根据 需求 预测 所 需 费用 、 流 量 、 转 化 等 数据 。 

示例 二 : 企业 下 个 季度 目标 日 均 UV 600 万 ， 现 需要 根据 需求 预测 各 媒介 流量 、 费 用 ， 并 计划 媒介 组 合 策略 。 

(2) 预测 只 对 可 控 媒 介 有 意义 

在 通常 情况 下 ， 企 业 的 营销 媒介 包含 两 种 : 一 是 可 灵活 控制 的 媒介 ， 如 某 个 网 站 的 广告 、 返 佣 类 渠道 等 ， 二 是 不 可 控制 的 媒介 ， 如 固定 投放 类 的 网 址 导航 或 SEM 品 牌 区 的 广告 。 


对 于 营销 预测 的 结果 实现 ， 具 备 可 行 性 空间 的 只 有 能 灵活 控制 媒介 ， 但 这 里 面 义 包含 两 种 特殊 形式 : 测试 投放 媒介 和 紧俏 资源 媒介 。 


测试 投放 媒介 ， 是 企业 为 降低 营销 风险 、 提 高 营销 投入 与 产 出 而 进行 的 新 的 合作 尝试 ， 这 类 媒介 由 于 测试 时 间 较 短 ， 通 常 很 难 具 备 严谨 的 数据 事实 。 
紧俏 资源 媒介 ， 这 类 媒介 虽然 效果 较 好 ， 但 媒介 资源 是 否 可 用 是 一 个 重要 问题 。 


(3) 预测 不 能 基于 未 发 生 的 事实 


营销 预测 只 能 基于 已 有 的 投放 数据 进行 ， 但 很 可 能 出 现 历史 数据 无 法 实现 企业 要 求 营销 所 达到 的 效果 ， 此 时 通过 数据 预测 将 变 得 非常 困难 。 


举例 : 现 有 日 均 300 万 的 流量 任务 ， 基 于 以 往 的 投放 数据 ， 每 日 峰值 是 200 万 UV， 即 使 将 每 个 媒介 效果 最 大 化 也 只 能 带 来 300 万 峰值 ， 剩 下 的 100 万 任务 无 法 通过 以 往 数据 获得 媒介 预测 结 
此 时 ， 单 纯 通 过 数据 无 法 直接 提供 结果 ， 但 数据 可 以 通过 具有 高 流量 爆发 能 力 的 类 似 渠道 进行 推论 ， 并 提炼 出 这 类 渠道 的 特 人 


HH 


为 营销 新 渠道 和 媒介 拓展 提供 参考 性 建议 。 
9.2.2 ”营销 时 的 异常 检测 与 及 时 反馈 


1. 异 常 检测 的 内 容 


异常 检测 是 营销 辅助 决策 的 重要 功能 点 ， 由 于 其 具备 实时 跟踪 、 实 时 反馈 、 实 时 优化 的 特点 ， 因 此 是 每 个 企业 营销 业务 的 重点 应 用 。 
异常 检测 的 核心 内 容 是 流量 作弊 ， 具 体 包括 : 
: 站 外 点 击 作 商 ， 即 通过 作 次 的 形式 产生 大 量 站 外 点 击 以 赚 取 广告 费 或 赢得 合作 信任 ， 最 常见 于 CPC 类 合作 广告 。 


. 站 内 订单 作 兰 ， 即 通过 作 产 的 形式 产生 大 量 恶 意 


订单 以 赚 取 佣金 ， 常 见于 CPS 类 返 佣 、 返 利 合作 渠道 。 
2. 异 常 检测 的 服务 对 象 
异常 检测 的 服务 对 象 通常 是 业务 执行 屋 ， 部 分 情况 下 也 汇报 给 营销 领导 


上 -口号 


层 。 当 异常 情况 发 生 后 ， 数 据 部 门 通常 会 协助 业务 部 门 一 起 研究 并 解决 异常 问题 。 
3. 异 常 检测 特征 与 检测 方法 


异常 检测 作 头 行为 通常 存在 一 定 的 特征 ， 根 据 其 作弊 程度 可 分 为 初级 作 浆 和 高 级 作弊 两 种 。 
(1) 初级 作 况 


流量 来 源 过 度 集中 ， 数 据 表现 为 : 地 域 异常 集中 、 时 间 异 常 集中 


、 页 面 过 度 集中 、 
平均 水 平 对 比 下 的 媒介 异常 、 新 老 访 问 异常 、24 小 时 流 


新 老 访 问 过 度 集中 、 来 源 渠道 过 度 集中 ， 与 此 同时 还 有 跳出 率 、 退 出 率 、 停 留 时 间 等 指标 也 相对 异常 。 图 9-6 所 示 为 与 
流量 异常 和 地 域 异 常情 况 。 


对 于 初级 作 浆 行为 ， 只 需要 碍 看 特定 媒介 下 的 各 个 细 分 数据 即 可 发 现 异 常 ， 这 种 作 闲 手 法 相对 简单 ， 存 在 量 较 少 。 


(2) 高 级 作 浆 


高 级 作业 是 相对 于 初级 作 次 而 言 更 高 级 的 手法 ， 其 数据 结果 是 : 上 述 访问 特征 正常 ， 除 此 之 外 甚至 还 具备 较 好 的 二 跳 率 ， 加 入 购物 车 、 注 册 等 特殊 转化 事件 ， 因 此 表面 看 来 不 具备 异常 特征 
区 别 于 初级 作弊 的 单 点 异常 特征 ， 高 级 作弊 需要 通过 宏观 的 、 关 联 的 视角 进行 分 析 才 能 找到 作弊 点 ， 常 用 方法 包括 页 面 热力 图 、 页 面 间 路 径 、 漏 斗 等 。 


新 老 访问 异 第 


新 访问 ， 老 访问 


24 小 时 流量 异常 
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图 9-6 ”四 种 初级 作弊 手法 


* 页 面 热力 图 。 大 多 数 时 候 ， 广 告 投放 都 会 追求 过 程 转化 效果 ， 如 注册 转化 、Call to action 转 化 、 试 用 转化 等 ， 某 些 程序 可 以 自动 针对 这 些 动作 进行 识别 并 完成 转化 事件 。 比 如 ， 作 新 可 以 制作 循环 点 击 
程序 ， 不 管 按钮 放 到 哪个 位 置 ， 程 度 都 能 捕捉 并 完成 ， 此 时 的 页 面 热 力图 将 呈现 如 图 9-7 所 示 的 特征 。 
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图 9-7 恶意 点 击 热力 图 


` 页 面 间 路 径 。 页 面 间 路 径 除 了 可 以 做 导 流 分 析 、 页 面 跳 转 分 析 、 用 户 行为 分 析 外 ， 还 可 以 做 异常 检测 分 析 。 某 些 情况 下 ， 恶 意 流量 可 能 沿 着 某 个 或 某 些 路 径 进行 转换 。 这 
路 径 ， 因 此 呈现 异常 特征 。 


Das 


路 径 通 常 不 是 网 站 的 主流 


. 漏斗 异常 。 按 照 正常 数据 ， 网 站 各 个 漏斗 节点 间 的 相对 转化 率 (下 一 步 相对 于 上 一 步 的 转化 率 ) 和 绝对 转化 率 下 一 步 相 对 于 起 始 步骤 的 转化 率 ) 较为 稳定 ， 如 果 在 某 个 环节 的 转化 率 突然 提高 或 下 
降 ， 很 可 能 是 异常 数据 。 此 时 ， 可 通过 异常 漏斗 节点 结合 渠道 来 源 进行 排查 。 


4. 异 常 检 测 的 业务 落地 
异常 检测 是 实时 分 析 的 主要 应 用 ， 通 过 自动 触发 或 手动 触 友 进 行业 务 提醒 和 优化 .。 


* 自动 触发 。 这 种 信息 是 在 建立 自 定义 预警 条 件 后 ， 当 触发 预警 时 自动 提醒 ， 通 常 可 通过 邮件 及 短信 进行 预警 。 但 这 种 应 用 只 能 针对 已 知 且 简 单 逻 辑 下 的 预警 判断 ， 如 针对 整体 或 细 分 下 茶 个 指标 进行 


* 手动 触发 。 这 是 对 自动 触发 信息 的 补充 ， 用 于 检测 计算 机 无 法 识别 的 预警 情况 ， 尤 其 适合 路 径 类 、 关 联 访问 类 的 信息 排除 。 


9.2.3 ”营销 结果 总 结 与 项 目 分 析 


营销 总 结 分 析 发 生 在 每 次 营销 活动 之 后 ， 用 于 总 结 此 次 活动 的 优 劣 得 失 ， 内 容 包括 整体 及 细 分 目标 的 完成 情况 、 存 在 问题 及 改进 空间 、 新 增 投放 效果 评估 、 模 块 间 协 作 等 : 
营销 活动 的 整体 及 各 媒介 效果 如 何 ， 是 否 达到 目标 ; 

影响 各 媒介 效果 发 挥 的 主要 因素 有 哪些 ; 

* 哪些 渠道 存在 优化 空间 ， 优 化 因素 是 什么 ; 

渠道 和 媒介 间 的 流程 协作 是 否 通畅 ， 存 在 哪些 整合 问题 ; 

“ 各 媒介 除了 完成 活动 目标 之 外 ， 还 有 哪些 新 、 奇 、 特 的 优势 和 特征 可 以 应 用 ; 

“ 新 增 投放 渠道 特征 和 用 户 画 像 是 怎样 的 。 

2. 莒 销 总 结 分 析 的 服务 对 象 


营销 总 结 分 析 服 务 于 领导 层 和 执行 屋 。 针 对 领导 层 的 汇报 侧重 于 整体 成 本 和 收益 、 目 标 完 成 度 、 部 门 间 沟 通 和 协作 问题 ， 针 对 执行 层 的 总 结 优化 侧重 于 各 细 分 模块 投放 效果 、 优 化 和 改进 分 析 。 


营销 总 结 的 分 析 方 法 请 参照 8.2、8.3 和 8.4 节 的 内 容 ， 在 此 不 做 歼 述 。 
4. 营 销 总 结 分 析 的 建议 
(1) 以 全 局 的 、 联 系 的 、 发 展 的 角度 看 待 营销 


. 全 局 的 。 营 销 业 务 的 特点 之 一 是 采用 “组 合 源 ”出击 ， 即 通常 情况 下 都 会 考虑 不 同 渠道 间 组 合 投放 或 整合 传播 。 在 做 效果 分 析 之 前 需要 数据 从 业者 了 解 营销 的 整体 目标 ， 然 后 才 细 化 到 各 业务 模块 。 
营销 业务 中 ， 每 种 媒介 都 有 自己 的 特质 ， 不 同 媒介 的 特质 可 能 侧重 于 广告 曝光 、 品 牌 导 入 、 转 化 购买 、 粉 丝 传播 等 ， 在 一 个 共同 目标 下 不 同 的 模块 所 承担 的 目标 是 不 同 的 。 


. 联系 的 。 企 业 传播 上 的 多 渠道 整合 营销 ， 一 定 会 带动 不 同 渠 道 间 产生 关联 效应 。 比 如 ， 投 放 广 告 会 为 品牌 关键 字 、 网 址 导航 等 入 口 型 渠道 导 流 ， 品 牌 曝光 又 会 引起 社交 媒体 更 多 的 “声音 ”， 这 些 都 
是 媒介 间 关 联 的 反映 。 在 营销 总 结 分 析 时 ， 需 要 关注 相同 层次 媒介 模块 及 不 同 层 次 媒介 的 相关 性 。 如 A 与 B、C 属 于 同一 级 别 ，A 与 B1、B2、C1、C2 属 于 跨 级 别 的 关联 。 


* 发 展 的 。 营 销 媒 介 的 不 断 测试 投放 与 知识 选 代 更 新 都 是 为 适应 媒体 和 客观 条 件 的 发 展 变 化 而 开展 的 ， 数 据 从 业者 需要 不 断 完善 业务 和 数据 知识 才能 与 业务 发 展 接 轨 。 


(2) 营销 流量 的 质量 评估 是 难点 工作 
针对 营销 业务 的 效果 评估 ， 流 量 数量 可 通过 UV、PV、 访 问 量 等 指标 直接 评估 要 素 ， 但 流量 质量 的 评估 不 仅 是 重点 还 是 难点 。 
一 方面 ，“ 质 量 ” 并 不 是 一 个 恒定 上 且 可 以 用 数据 直接 定义 的 指标 ， 不 同 目标 、 不 用 需求 、 不 同时 间 下 质量 定义 不 同 。 
一 方面 ，“ 质 量 ” 结果 的 影响 因素 多 种 多 样 ， 很 难 准 确 区 分 不 同 因素 对 “质量 ”的 影响 权重 。 例 如 ， 针 对 跳出 率 高 的 分 析 点 包括 三 方面 的 因素 : 
. 站 外 渠道 因素 ， 即 渠道 本 身 的 质量 因素 ， 包 括 群 体 喜好 、 需 求 、 媒 体质 量 等 ; 
` 站 外 广告 因素 ， 即 广告 素材 对 质量 的 影响 ， 包 括 广 告 卖点 、 宣 传 商品 、 促 销 价格 等 
" 站 内 自身 因素 ， 包 括 着 陆 页 设计 、 用 户 对 网 站 品牌 的 认 知 度 、 熟 悉 程 度 等 。 


以 上 三 方面 的 因素 综合 影响 跳出 率 ， 但 很 难 只 将 站 外 渠道 因素 分 离 处 理 并 得 到 渠道 本 身 的 质量 问题 ; 尤其 是 天 于 信息 匹配 度 、 需 求 吻合 度 、 价 格 敏 感度 、 需 求 强烈 度 、 品 牌 认 可 度 等 主观 数据 无 法 直接 
通过 数据 测量 。 


但 作为 数据 从 业者 ,仍然 有 一 些 方 法 : 
" 对 比分 析 。 它 是 评估 广告 流量 质量 的 实用 方法 ， 将 广告 流量 与 非 广告 流量 进行 对 比 即 可 了 解 到 底 是 渠道 质量 问题 还 是 网 站 自身 的 质量 问题 。 
“ 建立 复合 指标 评估 体系 。 将 用 户 的 复杂 行为 分 解 为 可 供 站 内 评估 的 目标 矩阵 ， 如 注册 、 试 用 、 订 单 、 产 品 页 浏览 、 加 入 购物 车 等 。 


A/B 测 试 ( 双 变量 测试 ) 。 它 是 找到 最 佳 方 案 的 有 效 手 段 ， 可 直接 对 比 发 现 影 响 渠 道 质量 的 关键 因素 。 


9.3 ”常用 的 网 站 营销 分 析 维 度 


9.3.1 目标 端 


目标 指 营 销 所 要 实现 的 目的 ， 目 标 分 析 是 营销 分 析 的 起 点 ， 也 是 评价 营销 活动 是 否 成 功 的 唯一 标志 。 常 见 的 营销 目标 包括 品牌 推广 、 活 动 促销 、 流 量 引 入 、 完 成 转化 (如 订单 转化 、 试 用 转化 、 预 订 转 
化 等 ) 四 类 。 每 次 营销 活动 都 存在 一 个 或 多 个 目标 ， 大 多 数 情 况 下 会 以 一 个 目标 为 主 ， 其 他 目标 为 辅 。 如 某 企 业 做 一 次 营销 活动 ， 核 心目 标 是 品牌 宣传 ， 辅 助 目标 是 流量 引入 和 活动 促销 。 


除 品牌 性 广告 主 以 外 ， 大 多 数 广 告 主 以 效果 类 广告 为 主 ， 如 流量 、 转 化 等 。 通 常情 况 下 ， 不 同 的 投放 渠道 会 有 不 同 的 子 目 标 ， 例 如 : 
* 广告 类 渠道 侧重 于 品牌 推广 、 活 动 促销 和 流量 引入 ， 其 中 的 流量 引入 偏 入 口 位 置 ; 

` SEM 类 广告 侧重 于 品牌 推广 和 完成 订单 ， 流 量 引入 偏 收口 位 置 ; 

. 会 员 类 渠道 侧重 于 会 员 回 访 和 完成 订单 ; 


. CPS 类 渠道 侧重 于 活动 推广 和 完成 订单 。 


9.3.2 ”媒体 端 


媒体 端 指 营销 活动 所 投放 的 媒体 ， 分 析 要 素 包括 媒体 渠道 、 媒 体位 置 、 媒 体 排 期 、 媒 体 预算 、 营 销 对 象 、 投 放 素 材 、 投 放 链 接 和 跳 转 、 媒 体 特质 和 特殊 分 析 要 素 。 
1. 媒 体 渠道 


媒体 渠道 指 投放 的 媒介 ， 部 分 特殊 媒介 可 进一步 细 分 。 例 如 ， 亿 起 发 、 返 利 网 等 更 像 是 一 个 媒介 联盟 ， 其 可 进一步 细 分 到 更 细 的 投放 媒介 载体 ， 如 旗下 的 A、B、(C 网 站 。 


媒体 渠道 需要 细 分 到 投放 网 站 级 别 ， 细 分 渠道 是 营销 分 析 的 第 一 步 。 通 过 该 步骤 可 以 定位 哪些 投放 渠道 ( 即 网 站 ) 存在 问题 。 
2. 媒 体位 置 


媒体 位 置 即 投放 网 站 上 的 广告 位 置 ， 大 型 媒体 的 同一 个 页 面 会 存在 多 个 投放 位 置 ， 不 同位 置 对 广告 效果 的 影响 不 同 。 媒 体位 置 对 广告 效果 的 影响 主要 是 通过 位 置 产 生 的 ， 基 本 规律 如 下 。 
* 首 屏 的 广告 效果 要 好 于 其 他 屏 ; 
. 底部 广告 会 好 于 中 间 楼 层 ; 
左 侧 的 广告 好 于 右 侧 。 
但 是 ， 以 上 规律 也 存在 例外 。 广 告 效 果 除 了 位 置 外 ， 还 受 其 他 重要 因素 的 影响 : 
“ 用 户 成 分 。 如 果 网 站 以 老 用 户 为 主 ， 对 网 站 结构 非常 熟悉 ， 那 么 位 置 对 广告 效果 的 影响 较 小 。 
* 广告 内 容 。 一 个 实际 的 例子 可 以 说 明 广 告 内 容 的 决定 性 影响 ， 如 果 iPhone 5 以 1000 元 的 价格 进行 推广 ， 不 管 位 置 在 哪 ， 效 果 都 不 会 差 。 


. 位 置 接触 成 本 。 不 同 的 广告 位 置 之 间 对 于 用 户 “ 接 触 点 ”的 差异 性 大 小 是 位 置 产生 影响 广告 效果 的 重要 因素 。 同 样 都 是 首 屏 的 广告 接触 点 的 距离 比 底 部 广告 的 距离 要 长 ， 此 时 位 置 的 差异 性 影响 是 显 
著 的 。 图 9-8 所 示 为 不 同 焦点 图 之 间 对 用 户 来 讲 “ 接 人 触 成 本 ”的 差异 性 较 小 ， 用 户 只 需 移动 很 短 的 鼠标 距离 即 可 查看 所 有 广告 。 
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图 9-8 ”广告 位 置 对 广告 效果 的 影响 


@ia 示 接触 成 本 指 用 户 为 了 看 到 广告 所 要 付出 的 成 本 要 素 ， 包 括 移动 鼠标 、 滚 动 页 面 、 查 找 时 间 、 耐 心 等 因素 。 位 置 对 于 广告 效果 的 影响 可 总 结 为 : 当 位 置 产生 的 接触 成 本 较 低 时 影响 较 小 ， 当 位 置 
产生 的 接触 成 本 较 高 时 影响 较 大 。 


3. 媒 体 排 期 
媒体 排 期 指 站 外 广告 宣传 的 起 止 时 间 因 素 ， 排 期 对 广告 投放 的 影响 效果 如 下 : 
* 短期 的 测试 效果 往往 不 稳定 ， 因 此 数据 很 难说 明 问 题 ; 
. 很 多 媒介 的 广告 效果 需要 “ 养 ”， 通 过 较 长 时 间 投 放 积累 来 培养 用 户 的 认 知 习惯 ; 
正常 上 班 时 间 比 节假日 投放 效果 好 ， 如 春节 期 间 效 果 会 非常 差 ; 
* 工作 日 比 休息 日 的 广告 效果 好 ; 
: 一 天 内 的 两 个 10 点 〈 早 10 点 和 晚 10 点 ) 、 下 午 3 点 的 投放 效果 好 于 其 他 时 间 。 
基于 这 些 因素 的 综合 判断 ， 可 以 通过 时 间 要 素 对 广告 效果 进行 分 析 。 
4. 媒 体 预算 


媒体 预算 对 广告 效果 的 直接 影响 是 预算 多 则 曝光 时 间 长 、 流 量 大 ， 因 此 产生 的 转化 较 大 。 因 此 ， 当 广告 按照 时 间 进 行 趋势 分 析 时 ， 如 果 发 现 某 天 或 某 个 时 段 流 量 突然 降低 ， 那 很 可 能 是 预算 限制 问题 
图 9-9 显 示 了 2014 年 5 月 5 日 广告 费用 对 广告 效果 的 异常 影响 。 
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图 9-9 ”广告 费用 对 广告 效果 的 异常 影响 
在 业务 实践 中 ， 预 算 问题 可 能 是 由 财务 付款 、 业 务 沟通 等 因素 导致 ， 这 些 属于 异常 数据 ， 在 做 广告 效果 评估 时 需要 根据 实际 情况 进行 处 理 。 
5. 营 销 对 象 


营销 对 象 即 广告 宣传 的 对 象 ， 如 品牌 推荐 、 活 动 促销 、 单 品 爆 款 等 。 营 销 对 象 是 影响 广告 效果 的 核心 要 素 之 一 ， 主 要 表现 在 : 符合 用 户 需求 的 影响 对 象 可 以 形成 用 户 的 共鸣 ， 因 此 可 以 产生 更 好 的 广告 
效果 。 共 鸣 点 包括 : 


“ 优质 且 低 价 的 商品 ; 
` 免费 领取 的 红包 、 优 惠 券 、 电 影 票 、 餐 券 等 ; 
. 行业 标杆 产生 的 促销 ， 如 iPhone 手机 、 联 想 小 Y 笔 记 本 系列 等 。 
一 个 契合 用 户 需 求 与 企业 营销 目标 的 对 象 ， 可 以 使 广告 效果 事半功倍 ， 也 是 成 功 营销 活动 的 基础 ;反之 ， 如 果 宣传 对 象 不 被 用 户 认可 ， 即 使 其 他 要 素 全 部 具备 也 很 难产 生 良 好 的 效果 。 
6. 投 放 素 材 
投放 素材 指 站 外 广告 投放 时 的 广告 素材 ， 素 材 设计 是 吸引 用 户 关注 和 点 击 的 重要 环节 。 素 材 对 广告 效果 的 影响 如 下 : 
. 广告 创意 。 与 众 不 同 的 创意 更 能 获得 用 户 的 关注 。 
` 素材 大 小 。 大 型 图 片 或 素材 更 容易 被 用 户 发 现 。 
. 标语 口号 。 好 的 广告 促销 语 可 以 让 用 户 产 生 驱 动 效应 。 
. 价格 因素 。 促 销 类 广告 对 于 折扣 、 价 格 更 敏感 ， 如 直 降 400 元 、3 折 。 
. 内 容 因 素 。 清 晰 、 关 注 度 高 的 广告 内 容 和 图 片 更 能 获得 用 户 认 可 。 
7. 投 放 链 接 和 跳 转 
投放 链接 指 用 户 点 击 广告 之 后 的 链接 页 面 ， 大 多 数 情 况 下 当 用 户 点 击 广告 之 后 直接 到 达 着 陆 页 ， 但 某 些 情况 下 也 存在 跳 转 。 链 接 和 跳 转 会 影响 以 下 几 个 方面 : 
. 跳 转 前 的 页 面 数 据 指 标 异 常 ， 表 现在 跳出 率 低 、 停 留 时 间 短 、 退 出 率 低 等 ; 


跳 转 页 面 和 之 前 的 页 面 路 径 过 度 集中 ， 页 面 访 问 关联 性 强 ; 


跳 转 之 后 的 页 面 丢失 渠道 跟踪 标记 ， 且 无 法 还 原 进 入 渠道 信息 。 

跳 转产 生 的 原因 通常 包括 以 下 几 个 方面 : 

网 站 通过 特定 技术 监测 重复 和 异常 订单 ; 

. 业务 方 为 了 提高 审核 效率 而 预先 给 媒体 提交 了 测试 页 面 ， 真 正 的 着 陆 页 链接 尚未 确定 ; 
. 营销 活动 进入 另 一 阶段 而 重复 提交 广告 链接 更 换 需 求 会 导致 无 法 及 时 跟 进 排 期 。 


识别 跳 转 链接 是 进行 数据 排查 和 异常 监测 的 重要 步骤 ， 同 时 也 是 理解 业务 工作 的 必然 途径 。 


8. 媒 体 特质 


每 一 类 媒体 都 有 自己 的 特质 ， 如 豆瓣 的 慢 文 化 、 人 人 的 学 生气 、 领 英 的 商业 社交 、 微 博 的 陌生 关系 和 媒体 属性 、 微 信 的 熟人 网 络 等 。 这 些 媒体 因 特 质 而 聚集 人 气 ， 即 物 以 类 聚 、 人 以 群 分 ， 具 备 不 同 特 
质 的 人 群 往往 也 具有 不 同 的 价值 观念 和 行为 趋向 ， 从 而 影响 媒体 与 广告 主 的 用 户 重合 度 、 需 求 匹配 度 、 信 息 表达 和 接收 、 行 为 表现 等 。 


9. 特 殊 分 析 要 素 
以 上 分 析 维 度 适 用 于 所 有 营销 渠道 ， 另 外 还 有 些 渠道 的 特殊 分 析 维 度 如 下 : 


pp > 


* 广告 类 渠道 。 在 广告 类 投放 渠道 中 ， 广 告 轮 播 次 数 、 特 殊 广告 形式 会 影响 广告 效果 。 轮 播 次 数 越 多 ， 单 个 广告 的 曝光 率 就 越 低 ; 弹 窗 、 背 投 等 异形 广告 会 更 加 吸引 用 户 关 注 。 


. SEM 类 渠道 。SEM 类 渠道 的 账户 体系 、 地 区 、 出 价 设置 、 匹 配方 式 、 投 放 设 备 、 自 动 广告 规则 、 自 动 优 化 策略 、 广 告 附 件 信 息 、 广 告 投放 范围 等 规则 设置 都 会 影响 其 流量 效果 和 转化 效果 。 
" EDM 类 渠道 。EDM 投 放 过 程 中 的 目标 人 群 选择 、 发 放 通 道 质量 、 服 务 提供 商 、 邮 件 标题 、 邮 件 正 文 等 都 会 影响 其 送 达 、 接 收 、 点 击 、 打 开 等 用 户外 部 动作 。 


. 新 媒体 渠道 。 新 媒体 渠道 包含 微 信 、 微 博 等 ， 其 转发 路 径 、 粉 丝 质量 、 帖 子 内 容 都 会 影响 其 投放 效果 。 


9.3.3 ”用 户 端 
用 户 端 的 分 析 维 度 包 含 用 户 属性 和 用 户 行为 两 方面 。 
1. 用 户 属 性 
用 户 属性 指 用 户 本 身 的 特征 和 要 素 ， 包 括 性 别 、 年 龄 、 收 入 、 地 理 位 置 、 设 备 、 新 老 特 征 等 人 口 社会 属性 数据 。 


性 别 、 年 龄 和 收入 主要 通过 CRM 系 统 获得 ， 网 站 分 析 工 具 提供 人 口 社 会 属性 是 通过 对 具有 特定 行为 的 用 户 进行 分 析 而 推测 该 网 站 的 用 户 所 具有 的 特性 ， 因 此 该 数据 不 是 用 户 真 正 的 人 口 属 性 数据 。 真 实 
的 用 户 人 口 社会 属性 数据 一 定 是 通过 企业 本 身 CRM 结 合 后 的 数据 。 


地 理 位 置 属 性 通常 来 源 于 两 个 方面 : 一 是 网 站 分 析 工 具 基于 IP 地 址 匹配 的 地 理 位 置 数据 ， 该 数据 由 于 IP 的 可 信 度 较 低 ， 因 此 存在 一 定 的 问题 ; 二 是 基于 真实 用 户 ID 匹配 的 真实 地 理 位 置 属 性 ， 该 数据 是 
用 户 真 正 的 地 理 位 置 属性 。 


设备 属性 包括 设备 浏览 器 (如 IE) 、 操 作 系统 (如 Windows) 、 设 备 类 型 (PC、 手 机 、 平 板 电脑 ) 、 设 备 名 称 (如 NOTE2) 等 。 设 备 属性 主要 作用 于 用 户 当时 的 操作 环境 ， 对 于 网 站 设计 具有 重要 参 


网 站 分 析 工 具 还 提供 了 基于 用 户 访问 次 数 的 新 老 访 问 、 客 户 留 存 、 访 问 活跃 度 等 数据 ， 这 些 是 评估 用 户 活跃 情况 的 重要 维度 。 
2. 用 户 行为 
用 户 站 内 行为 数据 包括 普通 页 面 访问 行为 、 搜 索 行为 、 转 化 行为 、 电 子 商务 行为 四 类 。 

- 页 面 访问 行为 包括 页 面 查看 、 点 击 等 基本 数据 ， 可 分 为 页 面 访问 和 页 面 内 链接 点 击 两 类 ; 

. 搜索 行为 是 用 户 站 内 喜好 和 需求 的 重要 表现 ; 

: 转化 行为 是 网 站 自身 定义 的 转化 目标 ， 包 括 注 册 、 下 载 、 预 门 、 接 受 服务 等 ; 

:电子 商务 行为 是 与 付款 相关 的 核心 转化 ， 包 括 订 单 、 预 付款 、 服 务 预 门 等 。 


用 户 行为 挖掘 是 营销 分 析 的 重点 ， 也 是 所 有 基于 网 站 分 析 工 具 提 供 价值 的 联系 纽带 。 所 有 营销 行为 的 本 质 都 是 用 户 行 为 ， 基 于 用 户 的 喜好 、 反 应 、 诉 求 、 动 作 是 营销 总 结 和 分 析 的 连接 点 。 


9.3.4 网 站 端 
网 站 端 主要 包括 着 陆 页 设计 、 关 键 表单 设计 和 站 内 流程 设计 三 部 分 。 
1. 着 陆 页 设计 


着 陆 页 设计 是 影响 站 外 营销 到 达 站 内 的 第 一 要 素 ， 也 是 站 内 漏斗 的 第 一 环节 。 着 陆 页 设计 的 好 坏 会 直接 影响 用 户 人 在 着 陆 页 的 直接 反应 ， 马 上 跳出 、 浏 览 后 跳出 、 浏 览 其 他 页 面 还 是 浏览 目标 页 面 等 ， 这 
分 别 代表 了 着 陆 页 体验 度 的 四 个 层次 。 


第 一 层次 : 当 用 户 到 达 着 陆 页 之 后 ， 仅 浏览 了 首 屏 (甚至 什么 都 没 看 ) 就 离开 网 站 ， 这 意味 着 用 户 的 体验 最 为 糟糕 。 
第 二 层次 : 当 用 户 到 达 着 陆 页 之 后 ， 昌 然 没有 浏览 其 他 页 面 ， 但 是 浏览 了 着 陆 页 的 其 他 屏 ， 并 停留 了 较 长 时 间 。 

第 三 层次 : 用 户 虽 然 继续 浏览 网 站 ， 但 其 路 径 不 是 页 面 设计 或 页 面 主题 预 设 的 路 径 ， 即 用 户 没 有 按照 预想 行动 。 
第 四 层次 : 用 户 按照 预想 进行 行动 ， 并 到 达 指 定 的 后 续 页 面 。 


aA 某 些 工具 可 检测 用 户 的 页 面 浏览 程度 ， 被 称 为 “页 面 浏览 百分比 ”， 通 过 分 析 页 面 滚动 条 在 整体 中 的 位 置 占 比分 析 页 面 被 浏览 的 比例 ， 如 Adobe Analytics、Webtrekk 都 提供 了 现成 的 插件 ， 其 
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他 工具 通过 页 面 内 不 同位 置 触 发 事件 也 能 实现 该 需求 。 


这 四 个 层次 依次 显示 了 不 同情 况 下 用 户 的 行为 结果 。 除 了 第 四 层次 外 ， 其 他 结果 都 符合 着 陆 页 设计 预期 。 仅 仅 使 用 如 跳出 率 、 二 跳 率 等 指标 很 难 评估 商业 目标 的 完成 程度 ， 因 此 需要 更 多 维度 进行 分 
析 。 


` 从 着 陆 页 到 上 一 步 〈 通 常 是 站 外 点 击 链接 ) 的 相对 转化 率 是 可 用 来 评估 到 达 率 的 ， 到 达 率 是 站 外 流量 入 站 效果 的 重要 指标 ; 
. 从 着 陆 页 开始 到 达 第 二 个 页 面 的 相对 转化 率 为 二 跳 率 ， 传 统 定义 的 方式 是 1 一 跳出 率 ， 这 里 建议 根据 网 站 的 实际 着 陆 页 目标 进行 定义 ， 如 发 生 某 个 事件 、 点 击 或 点 击 到 达 某 个 页 面 才 计 算 为 二 跳 ; 
* 着陆 页 的 跳出 无 法 准确 评估 页 面 的 停留 时 间 ， 可 通过 页 面 点 击 热力 图 、 页 面 浏览 百分比 、 下 一 步 访问 路 径 、 页 面 重复 刷新 率 、 特 殊 事 件 检 测 、 页 面 加 载 时 间 等 方法 分 析 用 户 在 页 面 上 的 行为 ; 


.着陆 页 除了 具有 较 强 的 目标 性 外 ， 还 具有 一 定 的 导 流 意义 ， 因 此 分 析 从 着 陆 页 到 其 他 页 面 的 分 流 效果 也 是 其 重要 环节 


* 除了 定量 分 析 外 ， 定 性 分 析 是 必 不 可 少 的 分 析 角 度 ， 如 信息 匹配 度 、 页 面 设计 体验 、 页 面 引流 设计 等 都 是 重要 的 感性 因素 。 
2. 关 键 表单 设计 


关键 表单 设计 是 影响 营销 效果 的 节点 因素 ， 表 单 设计 会 影响 营销 及 整 站 转化 效果 ， 包 括 注册 表单 、 登 录 表单 、 试 用 表单 、 预 定 表单 、 购 物 车 表单 等 。 关 键 表单 设计 对 营销 效果 的 评估 主要 体现 在 两 个 方 


(1) 表单 是 否 对 营销 效果 产生 影响 


不 同 媒体 的 用 户 具 有 不 同 的 偏好 ， 在 面 对 网 站 某 些 表单 时 会 表现 出 某 些 “不 适 ”。 如 对 具有 深度 网 购 经 验 的 返利 类 媒体 用 户 来 讲 ， 填 写 任何 电 商 表单 都 是 轻而易举 的 事情 ; 而 对 于 广告 类 媒体 的 “小 
白 ” 客 户 而 言 ， 复 杂 的 表单 会 让 他 们 望而生畏 。 


因此 ， 通 过 表单 分 析 的 第 一 步 能 判断 站 内 表单 是 否 对 营销 转化 产生 影响 。 
(2) 表单 对 营销 效果 的 影响 是 否 显著 
如 果 发 现 表单 对 用 户 产生 影响 ， 下 一 步 是 分 析 表 单 的 影响 显著 程度 ， 即 表单 是 否 已 经 严重 影响 了 营销 效果 并 成 为 其 转化 的 短 板 。 


判断 方法 是 通过 营销 表单 数据 与 非 营 销 表单 数据 及 全 站 表单 数据 的 对 比 ， 以 判断 这 种 影响 是 否 显著 。 如 果 发 现 营 销 渠 道 从 表单 到 下 一 步 的 转化 率 效果 要 显著 差 于 非 营 销 渠 道 ， 那 么 说 明 不 是 表单 本 身 的 
问题 ， 而 可 能 是 营销 渠道 用 户 属性 的 问题 。 


辐 注 总 不 存在 任何 一 种 表单 或 流程 适合 每 一 类 用 户 ， 用 户 是 挑剔 的 、 需 求 变化 着 且 不 可 捉摸 的 ， 因 此 企业 无 须 满 足 所 有 用 户 的 需求 ， 只 需 重 点 关注 其 核心 用 户 的 体验 。 
3. 站 内 流程 设计 


站 内 流程 设计 对 营销 效果 的 影响 是 潜在 的 ， 原 因 是 大 多 数 相同 类 型 的 网 站 流程 都 是 相似 的 。 站 内 流程 的 影响 与 表单 的 影响 类 似 ， 不 同 点 在 于 流程 设计 是 “ 线 ” 的 影响 ,而 表单 设计 是 “点 ”的 影响 。 营 
销 分 析 中 流程 设计 常用 的 分 析 维 度 如 下 : 


. 站 内 流程 共 分 几 种 路 径 ， 每 种 路 径 对 于 营销 的 转化 影响 如 何 ; 
. 某 些 渠道 是 否 具 有 特定 的 路 径 需求 和 特征 ， 是 否 可 以 有 针对 性 的 刺激 和 引导 其 行为 ; 
. 营销 渠道 在 站 内 流程 的 哪个 环节 存在 问题 ， 问 题 点 有 哪些 ， 该 问题 点 是 与 网 站 其 他 群体 相同 或 类 似 的 还 是 不 同 的 问题 点 。 
除 以 上 要 素 外 ， 网 站 自身 知名 度 、 市 场 占有 率 、 品 牌 美誉 度 及 口碑 等 因素 都 会 影响 用 户 的 消费 和 转化 信心 。 
9.3.5 ”竞争 端 
竞争 对 手 的 营销 投放 是 影响 企业 本 身 营销 效果 的 重要 因素 ， 其 主要 影响 以 下 几 个 方面 。 
1. 广 告 影 响 
当 竞 争 对 手 与 企业 在 相同 媒介 投放 广告 时 ， 品 牌 认 知 度 的 差异 会 导致 用 户 点 击 趋向 的 差异 ， 尤 其 是 两 个 广告 投放 的 内 容 类 似 的 时 候 ， 会 造成 用 户 选择 的 冲突 。 
举例 : 当 某 个 媒介 同时 投放 知名 企业 A 和 不 知名 企业 B 的 广告 ， 用 户 会 更 偏向 于 点 击 A 的 广告 。 
2. 活 动 冲突 


当 竞 争 对 手 与 企业 存在 相同 或 类 似 的 营销 活动 时 ， 用 户 会 被 分 流 而 产生 两 个 不 利 结果 : 一 是 用 户 提前 被 竞争 对 手 透支 了 消费 能 力 ， 企 业 的 营销 活动 效果 会 大 打折 扣 ;， 二 是 长 此 以 往 的 被 竞争 对 手 占 得 先 
机 ， 用 户 会 产生 一 种 趋向 ， 认 为 竞争 对 手 会 有 更 多 优惠 和 促销 活动 而 产生 品牌 偏好 ， 这 是 对 企业 长 远 发 展 的 不 利 因素 。 


当然 ， 广 告 冲 突 、 活 动 冲突 可 能 会 存在 一 种 “ 共 赢 ”效果 。 当 社会 整体 对 某 个 事物 或 活动 尚未 形成 大 规模 的 认 知 时 ， 大 量 企业 一 起 协作 并 集中 推出 活动 会 形成 一 种 人 为 的 促销 节日 气氛 ， 此 时 未 产生 购 
买 意愿 的 用 户 可 能 会 被 激发 出 购物 欲望 ， 从 而 使 参与 企业 都 得 到 不 同 程度 的 收益 。 


举例 : 当 京东 推出 618 活 动 时 ， 其 他 电 商 活动 同时 展开 ， 人 为 制造 了 一 年 中 最 重要 的 电 商 节日 一 一 618 活动 ， 大 多 数 参 与 企业 都 能 获 利 。 
9.3.6 ”其 他 因素 

除了 以 上 常见 的 分 析 维 度 和 因素 外 ， 还 有 一 些 特殊 情况 下 的 分 析 和 角度。 

1. 测 斌 性 广告 投放 


这 是 广告 投放 中 最 常见 的 现象 ， 测 试 性 投放 主要 是 新 合作 媒体 。 在 做 整体 广告 效果 评估 时 ， 一 种 方法 是 在 单独 拆 分 测试 广告 数据 并 作对 比分 析 ， 另 一 种 方法 是 将 测试 性 广告 数据 作为 异常 值 排除 在 整体 
数据 之 外 。 


全 注 总 无 论 采 用 哪些 方法 ， 测 试 广告 本 身 的 投放 效果 一 定 是 领导 层 重 点 关注 的 数据 。 因 此 ， 在 报告 中 一 定 要 有 一 部 分 内 容 单独 体现 。 
2. 内 赃 广 告 页 面 


内 嵌 广 告 是 将 企业 网 站 的 自身 页 面 作为 投放 媒介 的 子 页 面 进行 嵌 套 的 一 种 广告 形式 ， 这 种 形式 常见 于 企业 之 间 进 行 深度 合作 ， 整 个 媒介 页 面 全 部 是 企业 自身 的 促销 活动 或 广告 活动 。 图 9-10 所 示 的 区 域 
8B 为 企业 网 站 的 一 个 活动 页 面 ， 区 域 A 为 投放 的 媒介 页 面 ，A 和 B 之 间 通 过 Iframe 框 架 或 其 他 技术 进行 谋 套 ， 以 达到 进行 广告 展示 的 目的 。 


这 种 合作 形式 需 注意 : 一 定 要 去 除 页 面 源 代码 中 的 流量 监测 代码 ， 以 免 由 于 媒介 大 量 展示 造成 系统 并 发 数据 量 增加 而 导致 网 站 流量 系统 数据 延迟 甚至 崩 演 。 


图 9-10 内 谱 广 告 页 面 


@@ 注 意 ”该 页 面 需要 跟 其 他 营销 投放 媒介 一样 ， 通 过 URI 标记 来 源 信息 。 
当然 ， 如 果 企业 的 网 站 分 析 系 统 强大 到 足够 支撑 大 量 数据 请 求 时 ， 可 以 使 用 页 面 检测 代码 将 站 外 媒介 的 广告 曝光 全 部 检测 ， 这 是 检测 站 外 广告 曝光 数据 的 有 效 方法 。 


+ 总 在 大 多 数 情况 下 ， 对 于 一 天 上 亿 其 至 更 高 量 级 的 页 面 展现 来 讲 ， 很 少 有 几 款 网 站 分 析 工 具 能 做 到 完美 支撑 。 因 此 ， 不 建议 在 页 面 内 部 识 入 跟踪 代码 。 


9.4 ”网 站 营销 辅助 决策 四 大 案例 


专题 分 析 是 营销 辅助 决策 的 主要 内 容 ， 本 节 将 以 案例 的 形式 直接 剖析 每 种 业务 场景 的 数据 工作 思维 、 方 法 、 技 巧 和 流程 ， 内 容 涵盖 营销 专题 中 常见 的 恶意 流量 分 析 、 多 渠道 订单 归 因 分 析 、 渠 道 效 果 聚 
、 营 销 效果 分 析 。 专 题 分 析 中 的 案例 和 数据 基于 真实 场景 开展 ， 为 了 保护 数据 隐私 问题 进行 维度 匿名 化 和 数据 量 级 处 理 。 


状 


某 企业 与 A 媒介 合作 进行 流量 采 买 ， 合 作 周 期 结束 后 发 现 A 媒 介 昌 然 拥有 较 高 的 流量 数量 与 较 低 的 流量 成 本 ,但 其 在 线 订 单 转化 效果 较 差 。 因 此 ， 该 企业 营销 部 门 决定 针对 A 媒介 进行 深入 分 析 ， 以 确定 


A 媒介 是 否 存在 恶意 流量 的 问题 。 
ai 专题 背景 中 A 媒介 有 三 个 特点 : 流量 数量 高 、 流 量 成 本 低 、 订 单 转 化 效果 差 ， 由 此 可 见 A 媒 介 是 营销 的 重要 关注 点 ; 专题 分 析 通常 针对 此 类 对 全 局 有 重要 影响 的 业务 展开 。 
2. 前 期 沟通 
数据 部 门 接 到 需求 后 提出 了 以 下 几 个 问题 。 
问题 一 : A 媒介 的 在 线 转 化 效果 具体 数据 如 何 ? 为 什么 认为 效果 不 好 ? 
` 问题 二 : A 媒介 的 投放 起 止 时 间 及 业务 效果 评估 时 间 分 别 是 什么 时 候 ? 
“ 问题 三 : A 媒介 的 投放 标记 (跟踪 代码 ) 是 什么 ? 
` 问题 四 : A 媒介 的 站 外 投放 网 站 、 素 材 、 着 陆 页 分 别 是 什么 ? 投放 活动 共有 几 次 ? 有 几 种 投放 形式 ? 
的 租 析 问题 一 是 了 解 业务 判断 效果 “好 坏 ” 的 标准 ; 问题 二 是 通过 时 间 判 断 业务 的 数据 评估 时 间 是 否 合理 ;问题 三 和 问题 四 的 目的 是 了 解 业务 具体 实施 规则 ， 为 后 期 数据 工作 做 准备 。 
通过 与 业务 部 门 的 多 次 沟通 ， 其 结果 如 下 。 
. 问题 一 : A 媒介 的 在 线 订 单 转化 率 为 0.4%， 正 常情 况 下 A 媒介 转化 率 为 0.8%。 
" 问题 二 : A 媒介 的 投放 时 间 是 整个 5 月 份 ， 效 果 评 估 时 间 是 在 6 月 10 日 。 
“ 问题 三 和 问题 四 : 针对 A 媒介 的 实施 规则 ， 在 此 略 过 。 


全 组 析 ”经 沟通 发 现 ，A 煤 介 统 计 周期 内 的 转化 率 与 正常 相 比 差异 较 大 (一 们 的 差距 ) ， 且 数据 评估 时 间 可 以 较为 科学 的 反映 数据 事实 。 注 意 ; 通常 情况 下 ， 不 同 转化 目标 的 转化 周期 不 同 ， 如 注册 等 
动作 类 转化 周期 较 短 ， 通 常 发 生 在 单 次 访问 过 程 中 ; 订单 转化 类 转化 周期 稍 长 ， 根 据 商 品 属 性 存在 明显 差异 化 的 转化 周期 ， 一 般 情 况 下 客 单价 越 高 转化 周期 越 长 。 在 此 案例 中 , 项目 背 景 发 生 在 针对 快 消 商 
品 的 大 型 促销 活动 中 ， 因 此 10 天 的 周期 已 经 可 以 说 明 数 据 的 稳定 性 了 。 


3. 数 据 准备 

通过 业务 提供 的 针对 问题 三 、 四 的 反馈 。， 从 网 站 分 析 系 统 中 开始 调 取 数据 并 进行 数据 准备 工作 。 准 备 数据 时 发 现 以 下 几 种 异常 的 情况 。 
. 问题 一 : 5 月 1 日 的 转化 率 仅 为 0.01%， 大 大 低 于 日 常平 均 水 平 。 

问题 二 : 在 广告 数据 准备 过 程 中 ， 数 据 部 门 发 现 了 其 他 符合 业务 标志 特征 的 数据 ， 而 这 些 数据 不 在 业务 提供 的 检测 和 统计 范畴 之 内 。 


供 解 听 经 沟通 发 现 ， 转 化 率 仅 为 0.01% 是 由 于 统计 周期 开始 时 进行 了 大 量 测试 ， 而 第 二 个 问题 中 的 数据 确实 属于 应 该 归属 到 本 次 统计 周期 之 内 的 ， 业 务 方 由 于 广告 投放 素材 过 多 导致 统计 数据 遗漏。 


对 于 这 个 问题 的 处 理 方 法 是 如 下 。 
问题 一 : 直接 将 5 月 1 日 的 数据 排除 以 避免 对 整体 数据 的 影响 。 

二 : 将 数据 直接 归纳 到 整体 数据 中 进行 重新 评估 。 
仿 解 折 大 多 数 情况 下 ， 数 据 前 期 准备 时 需要 排除 吉 据 异常 值 、 缺 损 值 等 情况 ， 常 见 原因 是 业务 操作 过 程 中 存在 测试 错误 、 人 工 误 操 作 、 遗 漏 数据 、 标 记 错 误 甚 至 未 标记 等 问题 。 
4. 初 步 分 析 
在 数据 准备 过 程 中 发 现 了 两 类 数据 处 理 问题 ， 这 些 问题 是 否 会 影响 业务 最 终 对 结果 的 判断 ”如 果 吻 除 异 常数 据 并 将 遗漏 数据 重新 统计 ， 是 否 仍然 跟 业 务 方 最 初 的 判断 一 致 ? 
针对 这 一 问题 ， 数 据 部 门 重新 进行 了 数据 结果 评估 ， 结 果 发 现 整体 转化 率 为 0.5%， 虽 然 较 之 前 的 评估 结果 有 所 提升 ， 但 仍然 与 理想 水 平 有 所 差异 。 


ai 如 果 重 新 评估 之 后 发 现 转化 率 已 经 达到 0.7% 甚 至 更 高 的 水 平 ， 那 么 该 专题 需求 已 经 结束 一 一 业务 方 的 结论 假设 不 成 立 ， 因 此 没有 论证 分 析 的 必要 。 注 意 : 结论 评估 是 数据 工作 开展 的 基本 前 
提 ， 如 果 缺 少 该 步骤 很 可 能 导致 在 报告 完成 之 后 才 发 现 结论 是 错 的 ， 使 本 次 数据 分 析 工 作 失 去 意义 


~ 


第 一 步 : 找到 对 全 局 有 影响 的 细 分 要 素 。 
媒介 A 标 记 的 细 分 数据 ， 如 表 9-1 所 示 。 


表 9-1 媒介 A 细 分 的 标记 数据 


汇总 S18 312 3908 797 100 0.33 


分 析 表 9-1 的 数据 后 发 现 ， 在 细 分 数据 中 的 标记 2 转化 率 仅 为 0.29%， 其 他 标记 转化 率 为 0.27%。 初 步 判 断 标 记 2 和 其 他 标记 拉 低 了 媒介 A 的 整体 转化 率 
第 二 步 : 判断 对 全 局 影响 最 大 的 细 分 要 素 。 


标记 2 和 其 他 标记 到 底 哪个 是 最 重要 的 影响 因素 ， 通 过 表 9-1 中 的 数据 发 现 ， 标 记 2 访 问 量 占 比 为 519%， 是 最 主要 的 流量 贡献 ， 而 其 他 标记 仅 为 7%， 对 整体 影响 较 弱 。 因 此 ， 基 本 可 以 确定 标记 2 的 数据 
出 现 问题 且 对 全 局 产生 关键 影响 。 


第 三 步 : 找到 该 因素 的 关键 影响 节 
标记 2 漏斗 数据 ， 如 表 9-2 所 示 。 标 记 2 的 转化 率 效果 为 什么 这 么 低 ， 是 否 具有 了 明显 的 漏斗 节点 或 数据 特征 ? 
表 9-2 ”标记 2 漏斗 数据 
指标 人 值 指标 信 


访 | 上 266 加 入 购物 车 转化 率 0.5% 


访问 诬 度 , 870 
产品 页 5 


通过 表 9-2 中 标记 2 的 不 同 指标 值 ， 能 明显 看 出 跳出 率 数据 异常 。 跳 出 率 高 达 88% 说 明 用 户 到 达 着 陆 页 之 后 立即 离开 的 比例 过 高 ， 即 使 后 面 的 环节 转化 率 较 高 也 无 法 形成 较 高 的 订单 转化 率 。 同 时 ， 标 记 
2 的 访问 深度 只 有 1.1， 更 加 验证 了 上 面 的 结论 。 因 此 ， 着 陆 页 效果 异常 是 导致 标记 2 转化 率 低 的 主要 原因 。 


ini 对 于 跳出 率 高 的 判断 来 源 于 两 方面 的 经 验 : 一 是 其 他 广告 渠道 的 跳出 率 ; 二 是 本 渠道 的 历史 数据 。 另 外 ， 如 果 跳 出 率 不 存在 问题 ， 同 样 可 以 通过 漏斗 数据 分 析 依次 将 达 产 品 页 的 转化 率 低 、 加 
入 购物 车 转化 率 低 、 结 算 转化 率 低 等 关键 环节 进行 排查 ， 最 终 会 找到 关键 漏斗 节点 。 


第 四 步 : 诊断 跳出 率 高 的 问题 。 
现在 已 经 确认 是 标记 2 的 高 跳出 率 导 致 了 媒介 A 的 转化 效果 差 ， 那 么 高 跳出 率 就 一 定 是 标记 2 的 问题 吗 ” 是 否 人 存在 着 陆 页 本 身 的 设计 问题 ? 


用 户 到 达 着 陆 页 之 后 的 第 
用 户 浏览 数量 以 及 停留 时 间 的 分 析 。 


页 的 大 部 分 内 容 或 停留 了 较 长 时 间 。 众 所 周知 ， 针 对 跳出 页 面 无 法 通过 平均 页 面 停留 来 分 析 用 户 行为 ， 但 可 以 通过 其 他 方法 和 途径 来 实现 对 


` 通过 页 面 浏览 百分比 分 析 用 户 浏览 页 面 比 例 。 表 9-3 所 示 为 标记 2 着 陆 页 浏览 百分比 ， 通 过 表 9-3 着 陆 页 的 浏览 百分比 数据 发 现 52.4% 的 用 户 浏览 停留 在 首 屏 ， 有 81% 的 用 户 只 浏览 了 整个 屏幕 的 20%。 这 
数据 说 明 用 户 不 是 到 达 着 陆 页 之 后 马上 离开 ， 最 起 码 有 大 概 50% 的 用 户 浏览 了 首 屏 以 下 的 内 容 。 那 么 页 面 本 身 可 能 存在 一 定 的 问题 而 导致 用 户 缺 乏 页 面 停留 其 至 是 下 一 步 的 转化 动机 。 


表 9-3 ”标记 2 着 陆 页 浏览 百分比 


浏览 位 置 自 分 比 
0 0.9% 
10 1.6% 
20 3.8% 
30 3.2% 
40 4.6% 
50 


通过 页 面 像素 热力 图 和 链接 点 击 热 力图 ， 进 一 步 验证 上 述 结论 发 现 大 部 分 用 户 只 停留 在 页 面 上 部 而 较 少 的 浏览 到 页 面 中 间或 底部 ， 链 接点 击 热 力图 显示 了 首 屏 的 链接 点 击 比 例 仅 占 20%， 说 明了 看 到 
内 容 的 用 户 中 点 击 链接 的 比例 过 低 。 


- 通过 自 定义 时 间 收 集 器 跟踪 用 户 停留 时 间 ， 可 以 在 着 陆 页 不 同位 置 ( 如 顶部 、 四 分 位 处 等 ) 通过 JS 记 录 时 间 稚 ， 当 用 户 浏览 到 不 同位 置 时 做 相应 触发 并 记录 时 间 ， 最 终 将 不 同时 间 蕉 数据 相 减 得 出 用 


户 停留 时 间 的 数据 。 


除了 以 上 三 个 定量 分 析 因 素 之 外 ， 经 数据 部 门 分 析 发 现 : 站 内 外 的 广告 信息 宣传 基本 一 致 ， 排 除 信息 不 对 称 导 致 的 用 户 信任 和 跳出 问题 后 最 重要 的 是 ， 同 样 的 一 批 站 外 广告 素材 在 其 他 网 站 投放 广告 后 
到 达 着 陆 页 时 均 未 出 现 如 此 高 的 跳出 率 。 这 些 结论 使 得 标记 2 的 作 浆 特征 进一步 突出 ， 但 这 仍然 不 具有 说 服 力 ， 因 为 作 浆 特征 没有 被 清晰 的 描述 出 来 。 


第 五 步 : 异常 流量 来 源 特征 分 析 。 


日 期 分 析 特 征 。 针 对 标记 2 进行 按 日 的 流量 趋势 分 析 (目的 是 发 现 标 记 2 是 否 具有 明显 集中 于 菜 天 ) ， 如 图 9-11 所 示 。 从 图 9-11 标 记 2 每 日 访问 数 走势 图 发 现 ， 在 5 月 8 日 、5 月 18 日 和 5 月 28 日 三 天 流量 较 
大 ， 当 天 访问 量 超过 正常 情况 一 们 左右， 流量 较为 异常。 


标记 2 每 日 访问 数 走势 图 


5/1 5/3 5/5 5/7 5/9 5/11 5/13 5/15 5/17 5/19 5/21 5/23 5/25 5/27 5/29 5/31 


图 9-11 标记 2 每 日 访问 数 走 势 图 


:时段 分 布 特征 。 将 这 三 天 的 数据 分 离 出 来 ， 做 时 段 特征 分 布 ， 分 别 获 得 三 天 数据 的 24 小 时 流量 分 布 趋势 图 ， 如 图 9-12 所 示 。 


24 小 时 流量 分 布 趋势 图 
一 5_8 数 据 ”ee—5-18 数 据 一- 一 5-28 数 据 


1600 
1400 
1200 z 
1000 
800 AP /\ 


] 2 3 4 53 6 /7 8 9 10 11 12 13 14 12 16 1 18 19 20 21 22 23 24 


图 9-12 ”三 天 24 小 时 流量 分 布 趋势 图 
从 图 9-12 可 发 现 ， 三 天 数据 呈现 截然 不 同 的 分 布 状态 。 
. 5 月 8 日 : 上 午 8~10 点 间 的 数据 异常 增长 ， 呈 现 指数 级 趋势 ， 不 符合 正常 流量 增长 特征 。 
. 5 月 18 日 : 数据 整体 较为 平稳 且 符合 正常 时 段 的 访问 特征 ， 但 在 20 点 时 的 数据 异常 增加 ， 经 过 与 该 来 源 其 他 时 间 的 对 比 发 现 ， 该 时 间 点 数据 为 异常 增长 数据 。 
. 5 月 28 上 日 : 凌晨 4 点 ~ 上 午 7 点 间 流 量 处 于 较 高 的 状态 ， 明 显 不 符合 用 户 的 客观 实际 。 
三 天 的 异常 数据 已 经 剖析 完成 ， 但 这 似乎 还 不 具有 说 服 力 ， 我 们 再 通过 其 他 数据 强化 这 一 论证 : 
.来源 新 访问 比例 。 标 记 2 新 访问 比例 在 90% 左 右 ， 保 持 较 高 的 比例 。 
. 地 域 分 布 比例 。 标 记 2 的 地 域 来 源 除了 北 、 上 、 广 这 三 个 流量 区 域外 ， 还 有 一 处 是 Not Set。 
至 此 ， 基 本 可 以 判断 标记 2 恶意 流量 嫌疑 较 大 ， 换 句 话说 ,标记 2 基本 可 以 断定 是 恶意 流量 。 
的 解析 针对 着 陆 页 页 的 跳出 率 分 析 ， 涉 及 投放 媒介 、 用 户 、 网 站 三 个 主体 ， 其 中 任何 一 个 因素 出 现 问 题 都 会 导致 高 跳出 率 ， 因 此 不 能 因为 跳出 率 高 就 一 定 是 媒介 的 问题 。 
6. 沟 通 落 地 


过 以 上 分 析 得 出 的 结论 是 : 媒介 和 A 的 效果 差 主 要 是 标记 2 的 来 源 造 成 的 ， 而 标记 2 的 来 源 在 着 陆 页 的 异常 高 跳出 率 导 致 其 转化 率 低 从 而 影响 媒介 A 的 整体 转化 效果 ， 嫌 疑 时 间 段 主要 是 5 月 8 日 上 午 9~10 
点 、5 月 18 日 的 20 点 和 5 月 28 日 凌晨 4 点 ~ 上 午 7 点 。 同 时 ， 标 记 2 的 新 用 户 比例 过 高 ， 且 其 中 Not Set 的 异常 地 域 集中 都 说 明了 存在 较 大 的 用 计算 机 刷 流量 的 可 行 性 。 


通过 与 业务 方 的 深入 沟通 ， 标 记 2 还 存在 其 他 影响 其 高 跳出 率 的 因素 : 
* 标记 2 属于 新 增 投放 媒介 ， 广 告 效果 沉淀 需要 一 定 的 周期 ， 这 期 间 需 要 用 户 熟 悉 和 信任 网 站 ， 因 此 效果 可 能 存在 一 个 蓄积 时 间 。 


* 标记 2 来 源 中 的 新 访问 比例 高 于 媒介 A 的 整体 水 平 ， 即 使 同属 于 媒介 人 A 之 下 ， 不 同 标 记 来 源 也 存在 差异 性 特征 ， 新 用 户 转化 效果 要 弱 于 老 用 户 ; 如 果 标 价 2 来 源 长 期 集中 于 老 访问 但 转化 效果 依然 很 低 ， 
那么 说 明 标记 2 不 适合 再 做 针对 转化 的 效果 投放 。 


整合 上 述 所 有 结论 ， 数 据 部 门 、 业 务 部 门 和 媒介 投放 一 起 召开 了 三 方 沟通 会 议 ， 细 节 略 过 。 


9.4.2 ”多 渠道 订单 归 因 分 析 


某 企业 开展 在 线 营 销 活动 时 ， 经 常 需要 考虑 渠道 间 的 组 合 传播 规律 ， 该 规律 可 适用 于 营销 策略 制定 与 实施 优化 ， 现 需要 就 不 同 渠 道 间 对 订单 的 贡献 及 关联 影响 进行 分 析 。 


2. 前 期 沟通 
该 项 目的 服务 对 象 通常 是 营销 决策 负责 人 或 企业 负责 人 ， 这 属于 一 次 自 下 而 上 的 、 由 数据 部 门 提 出 建设 性 意见 的 课题 。 该 专题 的 背景 需求 从 数据 部 门 故 起， 同时 与 营销 各 部 门 负 责 人 进行 沟通 后 展开 。 
该 专题 要 解决 的 目标 问题 是 : 


企业 营销 传播 对 订单 转化 是 否 具 有 显著 意义 ? 
. 如 果 有 显著 意义 ， 如 何 安排 不 同 渠 道 间 的 组 合 传播 ， 包 括 顺 序 安排 、 时 间 间 隔 等 要 素 ? 
` 如 果 不 具 有 显著 意义 ， 是 否 具备 小 规模 适用 意义 ， 哪 些 媒体 间 特 征 较为 明显 ? 


i 在 企业 尚未 形成 数据 驱动 和 数据 工作 文化 之 前 ， 数 据 需求 通常 由 数据 部 门 发 起 ， 长 期 的 教育 、 培 训 和 引导 是 建立 自 下 而 上 数据 文化 的 重要 过 程 。 


3. 数 据 准备 
(1) 数据 时 间 区 间 
数据 时 间 区 间 是 数据 准备 的 首要 问题 ， 数 据 时 间 区 间 的 选择 受 以 下 几 方 面 因素 的 影响 : 


:转化 所 需 时 间 。 大 众 消费 品 、 快 消 品 的 决策 周期 通常 为 一 周 ， 电 子 数码 类 商品 通常 为 30 天 ， 保 险 金融 类 产品 可 能 需要 数 月 时 间 。 数 据 时 间 区 间 至 少 要 包含 转化 时 间 才 能 形成 有 效 转 化 数据 ， 如 针对 电 
子 数 码 类 商品 的 数据 时 间 可 选择 30 天 。 


. 广告 失效 时 间 。 所 有 的 网 站 分 析 工 具 都 有 广告 默认 有 效 期 ， 如 Goosle Analytics 默 认为 6 个 月 。 时 间 区 间 选 择 必须 在 广告 失效 之 前 才 有 效 ， 如 使 用 Google Analytics 的 多 渠道 订单 归 因 时 ， 数 据 区 间 建 议 不 
要 超过 6 个 月 。 


“ 营销 投放 周期 。 菜 些 情 况 下 ， 营 销 渠 道 不 同 阶段 具有 不 同 的 作用 ， 如 渠道 A 在 一 段 时 间 内 的 广告 投放 可 能 分 别 侧重 于 广告 曝光 、 活 动 刺 激 、 流 量 引 入 、 订 单 转化 四 个 阶段 ， 要 完整 评估 广告 效果 必须 
将 这 四 个 阶段 全 部 包含 在 内 。 


. 站 内 转化 活动 。 如 果 站 内 存在 活动 促销 ， 那 么 数据 时 间 区 间 一 定 要 完整 包含 站 内 促销 时 间 。 如 某 企 业 针 对 周年 庆典 进行 长 达 30 天 的 促销 活动 ， 期 间 活 动 分 不 同 的 波 次 、 子 活动 、 参 与 机 会 等 ， 要 完整 
记录 该 活动 的 转化 数据 就 要 将 时 间 区 间 选 择 在 30 天 以 上 。 


在 此 以 电子 数码 类 商品 为 例 ， 选 择 数据 时 间 为 45 天 。 
(2) 数据 分 析 维 度 


准备 数据 的 第 二 点 是 考虑 数据 维度 的 问题 ， 数 据 维度 决定 了 要 分 析 哪 些 方向 的 数据 。 这 里 要 针对 渠道 做 订单 归 因 分 析 ， 因 此 对 象 是 渠道 。 渠 道具 有 多 种 分 类 方法 ， 考 虑 到 落地 的 可 行 性 和 可 控 性 ， 这 里 
选择 站 外 投放 的 标记 渠道 。 


(3) 数据 分 析 工 具 
本 书 的 前 几 章 介绍 过 ，Google Analytics、Webtrekk、Adobe Analytics 等 工具 都 有 可 供 多 渠道 归 因 分 析 的 功能 ， 在 此 选择 Webtrekk 作 为 应 用 工具 。 
(4) 异常 数据 审查 

道 订 单 归 因 中 的 异常 数据 审查 主要 涉及 恶意 下 单行 为 ， 恶 意 下 单 能 客观 上 提高 下 单 渠 道 的 转化 效果 。 经 过 数据 排查 可 发 现 有 明显 的 异常 下 单数 据 。 
4. 初 步 分 析 
首先 ， 通 过 渠道 的 路 径 报 表 分 析 不 同 渠 道 间 关联 访问 并 下 单 的 数据 ， 部 分 数据 如 表 9-4 所 示 。 详 细 数 据 请 见 本 书 配套 资源 文件 数据 。 


表 9-4 ”渠道 关联 访问 路 径 


序 号 所 有 巡 介 路 径 转 化 


] 1426 
2 1131 
3 关键 词 一 品 牌 1025 
4 875 
5 823 
6 609 
7 603 
8 444 


其 次 ， 通 过 数据 处 理 细 分 所 有 路 径 中 单 渠 道路 径 和 多 渠道 路 径 的 数据 。 分 析 发 现 ， 单 渠 道 与 多 渠道 的 区 别 在 于 路 径 中 是 否 包含 “ 耻 ”， 包 含 “ 基 ” 则 说 明 用 户 通过 访问 多 个 渠道 下 单 ， 否 则 说 明 用 户 只 
一 次 访问 ( 单 渠 道 ) 下 单 。 因 此 ， 只 要 计算 出 路 径 中 的 “了 区” 数 便 能 得 到 路 径 中 渠 道 的 数量 。 我 们 通过 使 用 Excel 进 行 处 理 ， 步 又 如 下 。 


骤 一 : 打开 Excel， 依 次 选择 “开始 一 条 件 格式 一 突出 选择 单元 格 规则 一 文本 包含 ” 


二 : 在 弹出 的 对 话 框 中 ， 输 出 字符 “了” (不 带 “”) ， 如 图 9-13 所 示 。 单 击 “ 确 定 ”按钮 后 包含 “ 牙 ” ， 即 路 径 中 含有 超过 一 个 渠道 的 数据 显示 为 红色 (也 可 以 设置 为 其 他 颜色 ) 。 


包含 以 下 文本 的 单元 格 议 直 格 式 : 


0.314545455 


4.80285714 
0.69 


1.67 
4.034769231 
4.94440678 


图 9-13 ”使 用 Excel 条 件 规则 


步骤 三 : 依次 选择 “首页 一 排序 与 筛选 一 自 定义 排序 ”， 依 次 设置 主 关键 字 为 行 标签 、 排 序 依据 为 单元 格 颜色 、 次 序 为 红色 在 顶端 ， 如 图 9-14 所 示 


步骤 四 : 排序 后 对 有 颜色 和 无 颜色 的 数据 进行 分 别 汇总 处 理 ， 


如 图 9-15 所 示 。 


图 9-14 使 用 Excel 自 定义 排序 


标量 末 源 > 标 标量 来 源 CpSp 广 千 


SEMI SEMb SEM SEMI SEM > SEMb SEM SEMe 室 媒 体 * 富 
2 


ep | 


/ | 
2870| -SUM(numberT [numberal, - 

0.69| 

etra 

0.66 

3.885 

1 .B42857143 

1.01s 

O47 


图 9-15 分别 汇总 数据 
经 过 数据 汇总 和 处 理 后 ， 得 到 如 表 9-5 所 示 的 数据 。 


表 9-5 ”路 径 分 类 汇总 数据 


| 和 光 气 6019 25 
汇总 数据 100 


从 数据 中 发 现 ， 多 渠道 路 径 数据 的 转化 量 占 比 高 达 75%， 说 明 用 户 转化 过 程 中 ， 需 要 访问 的 渠道 数量 超过 1 个 的 路 径 比 例 为 75%， 但 结果 真 的 是 这 样 吗 ? 


多 渠道 路 径 或 媒介 组 合 传播 本 质 上 找到 “不 同 渠 道 间 ”的 路 径 访 问 规则 或 关联 性 。 仔 细 审 查 结果 数据 ， 图 9-14 数 据 中 的 第 二 条 记录 为 “SEMb> SEM”， 该 数据 的 意思 是 用 户 重复 通过 SEM 渠 道 进入 网 站 
并 经 过 两 次 转化 后 下 单 ， 本 质 上 这 仍然 属于 单一 渠道 路 径 。 同 样 的 道理 ， 图 中 存在 大 量 此 类 数据 ， 这 些 数据 需要 单独 处 理 并 还 原 成 单一 渠道 信息 。 


5. 深 入 7 分 析 
在 这 一 步骤 中 ， 我 们 需要 将 多 渠道 路 径 中 属于 单 渠道 重复 的 数据 进行 区 分 过 滤 ， 如 “ 富 媒体 有 辽 富 媒 体 ”、“RTB 了 RTB 了 > RTB”， 仍 然 使 用 Excel 进 行 数据 处 理 。 


步骤 一 : 将 所 有 路 径 中 渠道 数量 进行 汇总 统计 。 由 于 路 径 中 的 渠道 都 是 以 “有 辽 ”作为 分 隔 符 ， 因 此 可 以 通过 统计 “b 辽 ”出 现 的 次 数 来 计算 渠道 数量 。 在 右 侧 新 增 一 列 统 计 渠 道 数 量 的 列 ， 输 入 函数 


=LEN (B14) -LEN (SUBSTITUTE (B14, “BP”, ) ) +1 


该 函数 的 意义 是 查找 特定 字符 出 现 的 次 数 ， 后 面 的 “+1” 是 用 来 正确 输出 渠道 数量 。 例 如 两 个 渠道 之 间 是 一 个 “ 辽 ”， 十 个 渠道 之 间 是 九 个 “有 辽 ”以 此 类 推 。 输 入 函数 后 按 Enter 键 ， 并 双击 函数 右 下 
角 的 “十 ”标志 ， 使 该 公式 应 用 到 所 有 列 中 ， 如 图 9-16 所 示 。 


= 


图 9-16 ”查找 特定 字符 出 现 的 次 数 
步骤 二 : 排序 。 将 所 有 数据 行 按照 渠道 数量 进行 排序 。 将 鼠标 定位 到 渠道 数量 列 中 的 任意 单元 格 ， 依 次 选择 “开始 一 排序 和 人 筛选 一 升序 ”。 


步骤 三 : 数据 分 列 。 将 渠道 数量 >2 的 路 径 全 部 复制 到 新 的 Sheet 中 ， 选 择 该 列 并 依次 选择 “数据 一 分 列 ”， 在 弹出 的 设置 对 话 框 中 依次 设置 : 使 用 “分 割 符合 ”、 在 第 二 步 的 其 他 输入 框 中 复制 “了 区 
”再 单 击 “ 完 成 ”按钮 ， 如 图 9-17 所 示 。 


如 机 向 记 了 癌 守 -第 2 和 步 , 共 3 和 步 


Tab 键 站 
厂 | 分 号 (MI) 
四] 带 号 {QQ) 
客人 


EEM EN 
标 是 来源 慰 题 未 源 
二 航 后 

FFs CFS 


EE 此 
请 EF= 


图 9-17 ”数据 分 列 


步骤 四 : 判断 同一 行 中 不 同 列 的 数据 是 否 相同 。 该 步骤 是 确定 路 径 是 否 为 渠道 重复 路 径 的 关键 。 在 左 侧 新 增 一 列 ， 输 入 以 下 函数 : 


=COUNTIF (C2: P2, B2) +1 


再 按 Enter 键 ,并 将 该 公式 填充 到 整个 列 中 ， 如 图 9-18 所 示 。 


11 \ S S 品牌 营销 。 SEM 
人 和 群 定向 ”SEM 
标题 来 源 SEM 
SEM 


9 .SE EM 网 盟 搜 客 
| CPS 


=COUNTIF(C4735:P4735,B4735}+1 |SEM 


5| COUNTIF(range, criteria) 标 融 来 源 


SEM 


JEM 


SEM 
SEM 


图 9-18 ”统计 数据 出 现 的 次 数 


护短 析 。 Excel 中 有 多 种 方法 判断 多 个 单元 格 是 否 相等 ， 如 EXACT 可 以 判断 两 个 字符 完全 相等 ; 这 里 使 用 的 是 查找 功能 ， 目 的 是 查找 后 面 列 中 与 目标 列 (第 二 列 ) 相等 的 列 数 ， 如 果 相等 则 +1， 不 相等 


则 和 忽略; 最 后 的 “+1” 原 因 是 数据 从 第 三 列 ( 第 一 列 为 计算 列 、 第 二 列 为 参照 目标 列 ) 开始 计算 ， 因 此 需要 将 第 二 列 本 身 计算 在 内 。 田 外 ， 


的 渠道 数 是 15 个 ， 即 15 列 ， 因 此 需要 将 最 大 路 径 中 的 渠道 数 包 含 。 


步骤 五 : 汇总 路 径 数 据 。 将 步骤 四 中 得 出 的 数据 粘贴 回 原始 数据 表 中 ， 得 到 如 图 9-19 所 示 的 数据 表 。 


防 数 中 的 函数 区 域 使 用 C2~P2， 终 止 列 是 P2， 原 因 是 路 径 中 最 长 


转化 | 渠道 数量 | 相同 出 现 的 次 数 
i 


图 9-19 ”汇总 路 径 数 据 表 


步骤 六 : 验证 和 对 比重 复 路 径 数 。 新 增 一 列 判断 重复 渠道 的 列 ， 通 过 以 下 函数 判断 路 径 是 否 为 重复 渠道 : 


=IF (D4=FE4, 1, 0) 


函数 的 意义 为 : 如 果 渠 道 数量 与 相同 渠道 出 现 的 次 数 相等 ， 那 么 返回 1 (重复 路 径 ) ; 如果 不 相等 ， 则 返回 0 (不 重复 路 径 ) 。 结 果 如 图 9-20 所 示 。 


图 9-20 判断 是 否 重复 渠道 路 径 
转化 、 渠 道 数量 、 相 同 出 现 的 次 数 、 是 否 重复 渠道 路 径 列 中 的 所 有 数据 选中 ， 依 次 选择 “插入 一 数据 透视 


步骤 七 : 重新 计算 和 汇总 渠道 重复 数据 。 在 此 推荐 使 用 数据 透视 表 功 能 ， 将 序号 、 行 标签 、 
渠道 路 径 和 渠道 数量 ” 


表 ” 后 直接 单 击 “ 确 定 ”按钮 。 在 新 数据 透视 表 的 “ 行 ” 区 域 选择 “是 否 重复 ， 在 值 区 域 选择 “ 求 和 项 转化 ”， 如 图 9-21 所 示 。 


行 标签 圈 求 和 项 :转化 


五 8197 数据 透视 表 字 了 段 
| 15831 尘 择 要 添加 型 | 报 志 的 字段 
[| 

4 


6019 

4739 

1160| 
1605 

429 

492 

221 
286 YF 人 中 到 | 

115 

10 152 

J g8 

12 56 

13 45 

14 33 
15 381 

十 24028 


在 以 下 区 域 间 指 动 字段 : 


a BD Ti [上 


图 9-21 数据 透视 表 江 总 
重新 计算 路 径 分 类 汇总 数据 ， 如 表 9-6 所 示 。 


表 9-6 路径 分 类 汇总 数据 


分 Em 


多 汇 道 路 径 数据 8197 34 
单 路 径 数 据 15 831 66 
汇总 数据 24 028 100 


经 过 以 上 处 理 得 到 的 结论 是 : 多 渠道 路 径 (用 户 通过 访问 两 个 或 两 个 以 上 的 渠道 订单 ) 数据 带 来 的 转化 订单 量 仅 占 34%， 剩 下 的 66% 的 订单 是 由 单 渠 道 产生 的 。 因 此 ， 在 订单 转化 的 实现 过 程 中 ， 多 渠 
道路 径 即 整合 营销 传播 有 一 定 的 积极 意义 ， 但 并 没有 对 用 户 转化 产生 核心 的 影响 。 


在 企业 实际 数据 表现 中 ， 这 并 不 是 一 个 特例 。 根 据 笔者 接触 到 的 日 均 UV 在 100 万 以 上 的 几 家 涵盖 了 快 消 、 家 电 、 保 险 等 行业 的 公司 ， 发 现 该 规律 普遍 成 立 。 为 什么 多 渠道 整合 传播 对 于 用 户 转化 的 意义 
如 此 有 限 ， 或 者 换 句 话说 整合 传播 的 意义 没有 传统 宣传 中 的 那么 明显 


. Cookie 删除 机 制 。 虽 然 比例 较 小 ， 但 是 删除 Cookie 仍 然 意味 着 渠道 路 径 信息 无 法 关联 。 

. 媒体 碎片 化 严重 。 多 渠道 访问 转化 意味 着 用 户 需要 在 不 同 渠 道 间 重复 访问 ， 即 用 户 分 别 访问 了 A 和 B 之 后 ， 才 能 形成 由 A 到 了 B 的 路 径 ， 而 媒体 碎片 化 导致 这 种 重合 概率 变 小 。 
` 企业 投放 媒体 较 少 。 投 放 媒 体 较 少 会 直接 导致 数据 样本 量 不 够 ， 无 法 覆盖 用 户 重 复 访问 的 渠道 ， 因 此 无 法 得 出 有 意义 的 结论 。 

* 用 户 忠 诚 度 和 访问 习惯 。 高 质量 的 媒体 用 户 趾 诚 度 较 高 ， 这 些 入 口 习惯 会 让 这 些 渠 道成 为 对 转化 最 具有 价值 的 投放 媒体 而 无 需 再 通过 其 他 媒体 深入 转化 意识 。 


跨 设 备 追 踪 、 跨 平台 追踪 问题 。 之 前 用 户 跨 设 备 、 跨 平台 访问 无 法 关联 ， 寻 致 用 户 多 设备 、 多 平台 间 的 关联 失效 ， 例 如 用 户 在 手机 上 看 到 广告 ， 又 从 PC 端 完 成 购买 是 无 法 关联 的 。 即 使 是 目前 基于 用 
户 真 实 注 册 或 登录 ID 的 跨 设备 、 平 台 追 踪 也 无 法 从 本 质 上 关联 匿名 用 户 信 息 。 当 用 户 的 目的 只 是 浏览 信息 时 ， 为 什么 需要 登录 或 注册 ? 


. 最 后 是 一 个 猜想 ， 多 渠 道 组 合 传播 可 能 是 传统 广告 公司 的 嗪 头 ， 这 个 理论 确实 存在 意义 ,但 没有 绝对 性 的 数据 支持 以 及 主导 作用 。 


6. 深 入 分 析 


在 “深入 分 析 ” 中 仅仅 回答 了 一 个 问题 一 一 企业 曹 销 传播 在 订单 形成 过 程 中 是 否 具有 显著 意义 ” 剩 下 的 两 个 问题 将 在 本 节 进 行 探讨 。 


首先 来 分 析 单 一 渠道 路 径 数 据 ， 目 的 是 找到 用 户 访问 单一 渠道 即 完成 订单 的 特征 。 由 图 9-22 可 以 得 到 转化 访问 频次 分 布 规律 : 85% 的 转化 是 在 4 次 访问 以 内 完成 的 ， 次 数 增加 并 不 能 带 来 更 多 的 转化 效 


转化 访问 频次 分 布 


果 。 


1% 2% 1% 1% 1% 0% 


9 10 11 12 


图 9-22 ”转化 访问 频次 分 布 


事实 上 ， 图 9-22 中 一 个 奇怪 的 数据 是 绝 大 多 数 用 户 在 首次 访问 时 即 完 成 转化 的 ， 什 么 样 的 渠道 能 让 用 户 在 第 一 次 访问 就 产生 转化 动机 ， 首 次 访问 渠道 细 分 数据 如 图 9-23 所 示 。 


自 次 人 访问 渠 刀 


8 7% 6% 


3% 220 1% 


SEM 标题 来 源 三 千 导航 (> RIB 器 始 体 品 得 但 角 


图 9-23 ”首次 访问 渠道 细 分 数据 


从 图 9-23 的 数据 发 现 ， 其 中 大 部 分 属于 收口 类 型 的 渠道 如 SEM、 标 题 来 源 ( 注 : 一 种 特殊 的 品牌 广告 ) 、 导 航 、CPs 等 ， 这 些 媒体 占 比 合计 超过 80%; 另外 如 广告 、 


有 不 到 20%， 有 以 下 几 种 原因 能 解释 这 个 现象 
虽然 用 户 第 一 次 访问 该 渠道 ， 但 可 能 已 经 通过 其 他 未 被 关联 的 渠道 了 解 过 相关 信息 。 
. 该 渠道 的 用 户 患 诚 度 、 认 知 度 较 高 。 
* 用 户 的 冲动 型 购买 需求 体现 明显 。 


接 下 来 分 析 连 续 访问 两 次 的 渠道 数据 。 通 过 表 9-7 所 示 的 数据 发 现 ， 主 要 转化 仍然 集中 于 SEM、 标 题 来 源 、 导 航 、CPS 等 ， 该 数据 分 布 与 首次 访问 渠道 类 似 。 


1% 0% 


EDM 百度 移动 


语 媒 体 、 百 度 移动 、RTB 等 广告 占 


表 9-7 路 径 分 类 汇总 数据 


路 。 径 占 比 /% 
STR 于 骸 [ 399 8 
CPS * CPS 5 


一 
) 再 三 回 


二 妹 | 本 * 芋 画 群 体 


| | [i 
“DD ~ hnh 
“5 5 | 
[| 


RIB* RIB 也 
呈 牌 营销 * 入 有 牌 营销 2 
度 移 动 百度 各 到 
论坛 论坛 12 0 


值得 注意 的 是 ， 通 过 同一 渠道 重复 访问 并 最 终 下 单 ， 我 们 可 以 获得 渠道 间 访问 间隔 。 在 导出 的 原始 数据 表 中 ， 包 含 一 列 “ 平 均 转 化 接触 时 间 ”， 意 思 是 当 用 户 完 成 该 条 转化 所 需要 的 时 间 。 通 过 查询 该 
数据 得 出 ， 当 用 户 完成 “SEM>SEM” 需 要 0.7 天 ， 完 成 “CPSP>CPS” 需 要 2.6 天 ， 而 完成 “RTB 了 > RTB” 需 要 5.4 天 。 这 些 数 据 的 价值 是 : 当 CPs 广 告 投放 时 ， 如 果 要 在 两 次 访问 内 完成 转化 ， 那 么 至 少 需要 
2.6 天 投放 广告 以 便 给 用 户 充 足 的 再 次 进入 时 间 。 按 照 同 样 的 道理 ， 可 以 分 析 用 户 访问 3 次 、4 次 的 访问 间隔 属性 。 


换个 角度 思考 ， 如 何 发 现 某 个 渠道 的 用 户 下 单 访问 特征 ? 以 SEM 为 例 ， 完 成 SEM 单 一 渠道 的 投放 转化 具备 哪些 特征 ? 在 数据 透视 表 中 ， 过 滤 出 SEM 单 渠道 转化 数据 ， 如 表 9-8 所 示 。 


表 9-8 SEM 单 渠道 转化 数据 
路 径 转化 量 | 转化 量 占 比 /% | 接触 次 数 


SEM * SEM 2182 2 


SEM * SEM * SEM * SEM 725 4 
SEM* SEM * SEM * SEM » SEM 192 5 
SEM * SEM *» SEM * SEM * SEM * SEM 6 
SEM * SEM * SEM *» SEM * SEM * SEM * SEM 7 
SEM* SEM * SEM *» SEM * SEM * SEM * SEM » SEM 8 
SEM * SEM * SEM * SEM * SEM * SEM * SEM * SEM * SEM 55 9 
SEM * SEM * SEM * SEM * SEM * SEM * SEM * SEM * SEM * SEM 10 


SEM » SEM * SEM » SEM » SEM *» SEM *» SEM SEEM ASEM * SEM * | 
SEM 


路 径 转化 量 占 比 /% | 接触 次 数 


SEM * SEM* SEM* SEM* SEM* SEM* SEM* SEM* SEM * SEM* 
SEM » SEM 
SEM* SEM * SEM*» SEM * SEM* SEM*» SEM* SEM* SEM* SEM*| 
SEM * SEM » SEM 一 
SEM * SEM * SEM * SEM * SEM* SEM* SEM* SEM* SEM* SEM* 
SEM *» SEM » SEM * SEM 
SEM* SEM * SEM * SEM* SEM * SEM* SEM* SEM * SEM* SEM 
SEM * SEM * SEM * SEM * SEM 


在 SEM 单 渠道 路 径 中 (只 有 SEM 参 与 的 订单 路 径 ) ， 用 户 从 访问 1 次 到 访问 15 次 都 可 能 完成 转化 ， 但 转化 中 90% 主 要 集中 于 5 次 访问 以 内 ， 这 意味 着 大 多 数 SEM 转 化 只 需 接触 用 户 5 次 便 能 完成 。 


除了 模块 级 别 (SEM) 转化 路 径 外 ， 可 以 按照 关键 字 级 别 进 行路 径 分 析 。 关 键 字 路 径 由 于 包含 了 关键 字 信息 ， 可 以 应 用 到 业务 关键 字 调 整 策略 中 。 例 如 : 
某 个 关键 字 虽 然 长 期 参与 用 户 访问 路 径 ， 但 对 订单 的 转化 效果 贡献 不 大 ， 此 时 可 以 考虑 该 关键 字 的 投入 与 产 出 比 的 调整 。 

.路径 越 长 意味 着 关键 字 点 击 次 数 越 多 ， 想 获得 同样 或 相近 水 平 的 回报 收入 ， 必 然 会 选择 路 径 渠 道 少 即 点 击 次 数 少 就 可 完成 订单 的 关键 字 路 径 。 

* 结合 关键 字 路 径 的 转化 周期 ， 在 关键 字 调 优 时 提供 时 间 上 下 线 的 参考 依据 。 


. 转化 路 径 可 以 基于 关键 字 、 广 告 组 或 广告 计划 进行 分 析 ， 该 模型 可 以 综合 评估 每 个 关键 字 、 广 告 组 、 广 告 计划 在 订单 转化 过 程 中 的 作用 ， 前 端 引流 、 中 间 支 持 还 是 后 端 收口 ， 在 费用 控制 下 可 以 优先 
投放 具有 收口 作用 的 关键 字 。 


某 个 广告 活动 投放 周期 可 以 根据 用 户 访问 行为 进行 判断 ， 除 了 参考 促销 活动 周期 、 用 户 转化 周期 外 ， 不 同 路 径 长 度 下 的 转化 周期 也 会 纳入 考量 范围 。 


以 上 大 量 篇幅 介 绍 了 单一 渠道 路 径 下 的 访问 特点 ， 并 结合 渠道 访问 频次 、 访 问 周 期 、 转 化 占 比 等 特征 进行 分 析 。 以 下 我 们 针对 多 渠道 转化 数据 展开 分 析 。 对 于 多 渠道 的 订单 归 因 ， 以 SEM 为 例 展开 ， 目 
的 是 提炼 哪些 渠道 与 SEM 具 有 明显 的 前 后 关联 访问 关系 。 


全 汪 癌 在 本 篇 示例 数据 中 ，SEM 转 化 数据 贡献 最 大 ， 因 此 作为 多 渠道 路 径 分 析 的 切入 点 展开 ， 在 实际 应 用 中 如 果 没 有 特定 业务 需求 ， 建 议 读者 同样 优先 选择 最 重要 的 业务 节点 和 模块 。 
在 做 多 渠道 转化 贡献 之 前 ， 分 析 一 下 各 个 渠道 的 订单 参与 贡献 ， 该 数据 可 直接 从 Webtrekk “市 场 营销 一 客户 路 径 一 客户 路 径 中 的 媒体 广告 ”报表 获得 ， 部 分 数据 如 表 9-9 所 示 。 


表 9-9 各 渠道 订单 贡献 属性 


渠 记 转化 周期 接触 次 数 / 次 初始 接触 比例 /% 辅助 接触 比例 /% 最 终 转化 接触 比例 /% 


CPS 也 
EDM 1 
9 度 移动 219 79 


本 表 中 各 字段 内 容 的 解释 如 下 。 


“ 转化 周期 接触 次 数 : 用 户 在 转化 期 间 内 从 某 渠 道 进入 网 站 的 次 数 ， 接 触 次 数 不 等 于 访问 量 ， 等 于 从 营销 活动 点 击 进入 网 站 的 进入 次 数 。 
* 初始 接触 比例 : 渠道 在 用 户 转化 路 径 的 过 程 中 ， 处 于 初始 (第 一 个 ) 渠道 的 次 数 占 整个 渠道 接触 次 数 的 比例 。 如 果 用 户 营 销 活动 声明 周期 中 只 有 一 次 营销 接触 点 ， 那 么 它 会 被 记 为 最 终 转 化 。 计 算 
式 为 : 初始 接触 比例 = 初始 接触 次 数 / 渠 道 总 接触 次 数 。 


.辅助 接触 比例 : 渠道 在 用 户 转化 路 径 的 过 程 中 ， 处 于 中 间 位 置 ( 非 第 一 个 并 且 非 最 后 一 个 ) 渠道 的 次 数 占 整 个 渠道 接触 次 数 的 比例 。 如 果 用 户 营销 活动 声明 周期 中 只 有 两 次 营销 接触 点 ， 那 么 它 会 分 
别 被 记 为 最 终 转 化 和 初始 转化 ， 只 有 在 渠道 接触 次 数 超过 3 (二 3) 时 才 有 辅助 转化 。 计 算 公 式 为 : 辅助 接触 比例 = 辅助 接触 次 数 / 渠 道 总 接触 次 数 。 


最 终 转化 接触 比例 : 渠道 在 用 户 转化 路 径 的 过 程 中 ， 处 于 最 终 转 化 〈 最 后 一 个 ) 渠道 的 次 数 占 整 个 渠道 接触 次 数 的 比例 。 计 算 公式 为 : 最 终 转 化 接触 比例 = 最 终 转化 接触 次 数 /渠道 总 接触 次 数 。 


以 CPS 为 例 ， 上 表 数 据 反 映 出 : CPS 渠 道 有 转化 的 接触 次 数 为 15575， 占 所 有 渠道 整体 的 14.3%; 渠道 本 身 的 初始 接触 比例 达到 49%， 其 更 侧重 于 初始 接触 ， 说 明 其 在 流量 引入 或 活动 宣传 阶段 的 作用 明 
显 ; 对 比 其 他 渠道 ，CPS 在 订单 最 终 转 化 时 的 贡献 比例 较 高 ， 收 尾 作用 明显 。 


同 理 ， 其 他 渠道 的 特征 也 可 以 通过 该 方法 解读 出 来 ， 这 些 规律 可 以 考虑 的 应 用 如 下 : 具有 明显 的 前 端 初始 转化 的 渠道 是 否 可 以 考虑 进入 广告 宣传 活动 的 前 期 ， 成 为 营销 活动 的 “排头 兵 ”? 同样 ， 那 些 
具备 中 间 辅 助 和 后 期 收口 作用 的 渠道 ， 是 否 应 该 在 整个 营销 活动 周期 中 更 具有 时 间 科 学 性 ? 


对 于 渠道 之 间 的 关联 路 径 ， 以 SEM 为 例 将 含有 SEM 路 径 的 数据 单独 过 滤 ， 各 渠道 订单 贡献 属性 如 表 9-10 所 示 。 


表 9-10 各 渠道 订单 贡献 属性 


路 径 转化 接触 次 数 /次 


SEM * 杯 题 来 源 88 ji:3 
SEM * CPS 65 
标题 来 源 * 标 题 来 源 * SEM * SEM 

标题 来 源 * 标 题 来 源 * SEM 54 3 
SEM * 标 题 来 源 * 标 题 来 济 53 3 


[ 


表 9-10 中 的 数据 反映 出 SEM 路 径 数据 过 于 长 尾 ， 多 渠道 关联 最 强 的 “标题 来 源 辽 SEM” 转 化 比例 仅 占 1.6%， 其 他 2982 条 数据 具有 非常 强 的 分 散 特征 。 到 这 里 实际 上 已 经 阻碍 了 我 们 做 深入 的 数据 分 
析 ， 原因 是 这 些 数据 不 具有 明显 的 聚集 特征 ， 基 于 分 散 数 据 得 出 的 结论 适用 范围 非常 小 。 


不 过 ,我 们 还 是 要 继续 研究 一 下 ， 看 看 是 否 还 有 其 他 特征 。 将 上 述 数 据 表 进行 透视 分 析 ， 得 到 如 表 9-11 所 示 的 数据 。 


表 9-11 各 渠道 订单 贡献 属性 


接触 次 数 / 次 转化 占 比 /% 
1> 14 
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在 SEM 参 与 的 所 有 路 径 中 ， 接 触 次 数 与 转化 量 之 间 的 关系 ， 如 图 9-24 所 示 。 


两 者 关系 看 似 成 反比 ， 但 其 实 不 能 解读 为 接触 次 数 越 多 则 转化 效果 越 差 ， 原 因 是 这 个 模型 并 不 是 一 个 概率 性 事件 ， 即 接触 次 数 多 少 与 转化 量 成 可 能 性 大 小 的 关系 ; 而 是 在 已 经 完成 转化 前 提 下 的 接触 次 
数 的 分 布 规律 ， 换 句 话 说 只 是 一 个 频数 分 布 而 已 。 


图 9-24 ”SEM 参与 的 路 径 接触 次 数 与 转化 量 之 间 的 关系 


但 图 9-24 中 有 一 个 异常 点 : 当 接 触 次 数 为 15 次 时 转化 量 较 高 ， 该 规律 同样 存在 于 单 渠 道路 径 的 分 布 图 中 。 现 在 把 接触 次 数 15 次 的 所 有 渠道 进行 过 滤 ， 发 现 这 些 路 径 共 有 821 条 ， 转 化 量 最 高 的 路 径 
为 “SEMPCPSPCPpSPCpSP CPSPCPpSPCPpSPCPSPCPpSPCPSPCPSPCPSPCPSPCPSPCPS”， 转 化 量 占 比 仅 为 4%， 仍 然 具 有 长 尾 特 征 ， 其 特征 不 明显 。 


下 面 来 具体 分 析 下 到 | 底 哪 些 渠 道 与 SEM 具 有 明显 的 前 后 关联 访问 特征 ， 要 进行 渠道 间 的 关联 访问 分 析 ， 一 方面 可 以 导出 原始 数据 并 使 用 数据 挖 扎 工具 进行 ， 另 一 方面 可 以 使 用 现 有 的 网 站 分 析 工 具 直 接 
应 用 。 


(1) 使 用 数据 挖掘 工具 


所 有 原始 日 志 数 据 导出 后 ， 日 志 中 都 包含 以 下 几 个 字段 。 
:时间 玲 : 每 次 访问 的 开始 时 间 。 

.来源 渠道 标志 : 标志 访问 从 哪个 来 源 进 入 。 

. 唯一 用 户 识别 标志 : 识别 唯一 UV 的 CookieID。 


基于 关联 规则 的 应 用 场景 ， 可 以 这 样 来 应 用 流量 来 源 的 关联 模型 : 以 CookielD 作 为 唯一 的 用 户 ID 标 志 ， 以 时 间 戳 作为 时 间 序列 字段 ， 以 来 源 渠 道 作为 目标 项 集 。 关 于 关联 模型 的 用 法 在 之 前 的 章节 中 多 
次 介绍 ， 请 查看 第 2 章 2.3.3 节 的 “数据 挖 气 ” 和 第 8 章 的 8.3.3 节 “探究 原因 的 分 析 方 法 ”中 的 关联 模型 介绍 。 


ia 要 使 用 数据 挖掘 工具 挖掘 渠道 间 的 关联 访问 关系 ， 需 要 读者 熟悉 原始 日 志 中 的 字段 和 含义 ， 尤 其 是 关联 模型 中 使 用 的 时 间 惟 、 来 源 渠 道 标 志和 唯一 用 户 识别 标志 ， 这 是 做 关联 模型 的 基础 。 另 
外 ， 还 需要 网 站 分 析 工具 支持 原始 日 志 寻 出 功能 ， 同 时 在 原始 日 志 大 规模 数据 量 下 ， 需 要 计算 机 具有 较 强 的 运算 能 力 。 


(2) 使 用 现 有 网 站 的 分 析 工 具 
使 用 Webtrekk 可 以 直接 应 用 关联 模型 分 析 功 能 ， 其 配置 步骤 如 下 。 


步骤 一 : 打开 “系统 配置 一 关联 ”， 上 点击“ 新 配置 ”， 进 入 图 9-25 所 示 的 配置 界面 。 


追加 销售 序列 分 析 


追加 请 售 序列 分 析 
交 久 销 售 -关联 分 析 
四 是 铭 吾 


图 9-25 Webtrekk 关 联 模 型 配置 界面 
步骤 二 : 填写 好 标题 、 描 述 并 启用 该 模型 。 


步骤 三 : 设置 分 析 类 别 。 选 择 “ 追 加 销售 序列 分 析 ”， 追 加 销售 序列 与 交叉 销售 的 区 别 在 于 ， 交 叉 销 售 是 在 一 次 访问 过 程 中 产生 的 ， 而 追加 序列 是 在 多 次 访问 中 产生 的 ， 并 伴 有 序列 模式 。 由 于 分 析 目 
标的 行为 是 基于 多 次 访问 来 源 产生 的 ， 因 此 需要 选择 追加 模式 。 如 果 是 在 一 次 访问 中 产生 的 ， 如 页 面 浏览 、 事 件 、 搜 索 等 可 选择 交叉 销售 模式 。 


步骤 四 : 设置 更 新 周期 。Webtrekk 提 供 了 每 日 、 每 小 时 和 一 次 性 ， 这 里 选择 每 日 ， 原 因 是 我 们 要 每 日 都 更 新 该 模型 。 


步骤 五 : 设置 规则 。 分 析 目 标 是 渠道 间 的 关联 关系 ， 可 选择 的 粒度 包含 模块 (Module) 、 渠 道 (Channel) 、Section13， 这 些 渠道 和 模块 的 粒度 是 管理 员 在 市 场 营 销 配置 中 自 定义 的 。 这 里 选择 
Module (模块 级 别 ， 如 SEM、 广 告 、CPS 等 ) ， 如 图 9-26 所 示 。 
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thannel 

Module 

section1 

sectionz 

section3 

一 神 内 容 
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已 查看 Product Category 1 
已 查看 Producdt Category 2 
已 查看 Producdt Category 3 
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已 喇 买 Product Category 2 
已 唤 区 ProductCategory 3 
已 购 世 产品 

站 内 搜索 语 品 

站 四 搜索 语 避 


图 9-26 设置 关联 规则 


步骤 六 : 高 级 设置 。 通 过 设置 最 小 频次 (最 小 置信 和 度 ) 、 追 加 销售 时 间 来 提高 针对 性 。 为 了 进行 规则 测试 ， 设 置 最 小 频次 为 1%， 时 间 为 30 天 ， 如 图 9-27 所 示 。 


最 小 频次 ] |% 通 过 这 个 配置 ， 你 可 以 排除 罕见 的 栅 则 。 
追加 销售 时 间 段 : | 第 一 个 时 间 过 后 的 天 数 。 


过 滤 丫 (+) 二 
本 可 [URM -访客 ID [wll 等 加 | 


| 迟 回 . | 


图 9-27 “高 级 配置 ”界面 
配置 完成 之 后 可 以 在 前 台 “ 电 子 商务 -关联 ”报表 中 找到 关联 模型 报表 。 以 SEM 为 例 ， 部 分 关联 报表 数据 如 表 9-12 所 示 。 


表 9-12 ”SEM 关联 报表 数据 
规 则 数量 (频繁 项 集 ) /次 文 持 度 /% 频次 (置信 和 度 ) /% 


SEM "标题 来 尖 $8 5 


CPS * SEM 4.7 9.7 
SEM * 导 航 138 3.8 11.2 
SEM * 扣 了 牌 营 销 136 3.7 6.2 


导航 SEM 
SEM * 广 告 


SEM* 富 媒体 2.9 5.0 
\ 


广告 x SEM ; 


蜗 媒 体 » SEM 
65:3 


站 和 晶 党 稍 * SEM 1 


‘ 
te 
tn 


如 何 解 读 关 联 模型 结果 ? 
规则 : 关联 规则 中 的 频繁 项 集 ， 显 示 了 渠道 间 的 关联 关系 结果 ， 如 “SEM 贡 标题 来 源 ”意思 是 先 访问 SEM， 然 后 访问 标题 来 源 。 
. 数量 (频繁 项 集 ) : 关联 模型 中 的 实例 数 ， 即 关联 规则 的 数量 ， 如 “SEM 隐 标题 来 源 ” 数 量 为 194， 其 含义 是 该 规则 出 现 次 数 是 194 次 。 


支持 度 : 支持 度 显示 的 是 A 和 B 同 时 出 现 的 概率 ， 计 算 逻 辑 是 规则 出 现 次 数 整 体 的 比例 ， 公 式 为 Support (A>B) =P (AUB) ， 如 “SEM 隐 标题 来 源 ” 的 支持 度 为 5.3%， 其 意思 是 该 规则 同时 出 现 的 概 
率 是 5.3%0。 


. 频次 〈 置 信 度 ) : 关联 模型 中 的 置信 度 ， 置 信 度 显示 了 出 现 A 的 情况 下 出 现 B 的 比例 ， 公 式 为 Confidence (A>B) =P (A|B) ， 如 “SEM 辽 标题 来 源 ” 的 置信 度 为 15.4%， 其 意思 是 当 用 户 访问 SEM 之 
后 ， 又 访问 标题 来 源 的 概率 是 15.4%。 


数量 、 支 持 度 和 频次 通常 作为 评估 关联 规则 是 否 显著 的 三 个 关键 指标 ， 需 要 综合 使 用 。 如 表 9-12 中 的 “EDM 苯 SEM” 虽然 出 现 的 次 数 少 ， 只 有 53 次 并 且 支 持 度 仅 有 1.49%， 但 其 置信 度 水 平 非常 高 ， 当 
用 户 访问 了 EDM 之 后 ， 再 从 SEM 访 问 的 概率 达到 26.0%。 因 此 ， 不 能 只 用 一 个 指标 来 判断 关联 结果 的 强 弱 和 应 用 关系 。 


通过 分 析 得 到 了 SEM 关 联 访 问 的 渠道 特征 ， 包 括 从 SEM 进 入 之 后 下 次 会 访问 其 他 哪些 渠道 以 及 SEM 的 上 游 渠 道 信息 。 
7. 沟 通 藻 地 


通过 以 上 分 析 ， 可 以 得 到 关于 所 有 渠道 的 交叉 访问 现状 以 及 渠道 间 是 否 具有 明显 的 关联 访问 关系 ， 并 且 了 解 了 渠道 在 多 渠道 路 径 转 化 过 程 中 不 同位 置 的 参与 和 贡献 比例 ， 最 后 又 通过 关联 模型 得 出 具体 
渠道 之 间 的 上 下 游 关 系 。 这 些 结论 已 经 可 以 回答 本 篇 开始 提出 的 三 个 问题 ， 接 下 来 就 是 把 这 些 结论 反馈 给 企业 领导 ， 找 一 个 好 的 契机 、 好 的 场合 ， 优 先 与 营销 负责 人 进行 沟通 ;然后 再 决定 是 否 要 跟 企 业 最 
高 决策 层 沟通 。 


全 提示 “永远 不 要 越权 | 尤其 涉及 跨 中 心 或 公司 级 别 的 信息 汇总 一 定 要 经 过 中 心 最 高 领导 确认 ， 这 是 涉及 影响 决策 问题 的 关键 流程 。 


某 企 业 需 要 对 大 量 推广 渠道 的 广告 效果 进行 评估 ， 以 实现 有 针对 性 的 广告 效果 测量 和 优化 工作 。 
if 针对 大 量 推广 渠道 进行 分 析 的 第 一 步 通常 是 进行 广告 分 类 ， 即 按照 一 定 的 广告 属性 和 测量 维度 将 广告 聚 类 ， 然 后 再 根据 不 同 的 广告 特点 及 业务 重点 进行 有 针对 性 的 分 析 。 
2. 前 期 沟通 
该 专题 的 需求 发 起 于 数据 部 门 内 部 ， 目 的 是 针对 此 前 开展 的 大 量 广告 投放 活动 进行 初步 评估 。 在 开展 分 析 工 作 之 前 先 确认 以 下 间 题 : 
* 广告 渠道 的 范畴 是 什么 ? 具体 包括 哪些 渠道 ? 一 一 所 有 站 外 标记 的 广告 类 渠道 (以 ad_ 开 头 ) 。 


“ 数据 集 时 间 选 择 哪个 时 间 段 ? 一 一 最 近 90 天 的 数据 。 


` 数据 集 选 择 哪些 维度 和 指标 ? 渠道 
广告 类 型 、 合 作 方式 、 广 告 尺寸 、 广 告 卖点 。 


首 代号 、 上 日 均 独特 访客 、 平 均 注 册 转 化 率 、 每 次 访问 的 平均 搜索 量 、 每 次 访问 的 平均 页 面 查看 次 数 、 每 次 访问 过 留 时 间 、 订 单 转 化 率 、 投 放 总 时 间 、 素 材 类 型 、 


专题 分 析 要 解决 什么 问题 ? 将 广告 分 类 并 为 接 下 来 的 业务 讨论 和 数据 分 析 提 供 支持 。 


锚 解 折 ” 滋 类 分 析 通 常 是 其 他 数据 控 气 和 分 析 的 第 一 步 ， 但 却 是 非常 重要 的 一 睹 
供 直接 、 可 行 的 业务 结论 或 行动 建议 。 


， 聚 类 可 以 在 没有 已 知 经 验 的 前 提 下 提供 初期 数据 价值 提炼 工作 。 但 由 于 其 作用 侧重 于 初步 研究 ， 因 此 聚 类 分 析 无 法 提 


3. 数 据 准 备 


按照 上 述 预 设 条件 ， 将 符合 广告 规则 的 数据 集 导 出 ， 具 体 数据 见 随 书 资源 文件 的 专题 原始 数据 " 
本 的 数据 质量 校 验 外 ， 还 有 以 下 几 个 方面 的 原始 数据 需要 注意 : 


渠道 效果 聚 类 ”部 分 。 数 据 准 备 时 ， 数 据 的 校 验 和 修正 是 必 不 可 少 的 工作 。 对 于 聚 类 分 析 而 言 ， 除 了 基 


` 原始 数据 之 间 最 好 不 要 具有 高 度 相 关 性 ， 否 则 会 拉 大 高 相关 性 数据 的 权重 导致 结果 失衡 。 
为 了 避免 原始 数据 集 量 级 差异 导致 的 聚 类 偏差 ， 需 要 将 数据 进行 标准 化 。 
为 了 迅速 验证 以 上 数据 ， 我 们 使 用 PASW Statistics18 实 现 (在 下 面 的 初步 分 析 中 会 介绍 使 用 Clementine 进 行 相关 性 分 析 和 标准 化 的 工作 ) 。 


(1) 输入 数据 


步骤 一 : 设置 变量 。 打 开 PASW Statistics18， 点 击 底 部 
属于 字符 串 型 ， 其 他 属于 数字 型 


| 类型 “| 宽度 NE | ee 


字符 昌 


“变量 视图 ”。 将 原始 字段 名 依次 填 入 变量 名 称 中 ， 同 时 设置 变量 类 型 ， 其 中 渠道 代号 、 素 材 类 型 、 广 告 类 型 、 合 作 方式 、 广 告 尺寸 、 广 告 卖点 


， 如 图 9-28 所 示 。 


澡 首 代号 

日 均 独 特 访客 
平均 注册 转 ..， 寺 
每 次 访问 的 间 


卉 名 X(N) 
大 度量 (3) 
地 度 里 (S) 
霓 度 里 (S) 


sf 


每 次 访问 的 .上 
每 次 访问 去 .…. EE 
订单 转化 训 


六 度量 (8) 


过 度 里 (S) 


六 度 里 (S) 


投放 总 时 间 
素材 类 型 
广告 类 型 
合作 方式 
广告 尺寸 
广告 卖点 


字 人 峡 串 


移 度 里 (S) 
移 名 x{N) 
肛 名 X(N) 
和 名 六 (全 
be 名 穴 { N) 


字符 串 
字符 串 


由 于 守则 | 周 | 内 | 计 则 i 


字符 串 


局 | 忆 | 己 | 己 | 号 | 上 Mnmlrol 安 
et 
阱 [所 | 装 | 阶 | 所 | 计 放 证 计 计 计 放 了 羡 


本 


字符 串 


图 9-28 设置 变量 


步骤 二 : 变量 输入 数值 。 点 击 底部 左下 角 
和 图 9-30 所 示 。 


“数据 视图 ”进入 数据 输入 视图 。 复 制 原始 数据 集 字 段 名 以 外 的 所 有 数据 ， 在 左上 角 渠 道 代号 单元 格 区 域内 部 ， 右 击 选 择 粘 贴 (或 直接 按 Ctrl+V) ， 如 图 9-29 


(2) 相关 性 分 析 


步骤 三 : 打开 相关 性 分 析 窗 口 。 依 次 选择 顶部 菜单 栏 “ 分 析 一 相关 一 双 变 量 ”， 打 开 相 关 性 分 析 窗 口 ， 如 图 9-31 所 示 。 


渠道 代号 ”| 日 均 独特 访客 | 平均 注册 转化 | 每 次 访问 的 平 | 每 次 访问 的 平 | 每 次 访问 逗留 
均 搜 索 量 ”| 均 页 面 查看 次 | 时 间 


订单 转化 挛 | 投放 总 时 间 


前 切 人 T) 
县 制 {C) 


粘贴 (P) 

清 际 {E) 

网 格 字 伟 
5 拼写 .. 


图 9-29 ”粘贴 数据 


日 芍 扫 特 访 寡 | 平 均 注 册 转 化 | 每 次 访问 的 平 | 每 次 访问 的 平 | 每 次 访问 逗留 | 订单 转 亿 票 | 返 需 总 时 间 


图 9-30 “完整 数据 显示 


康 件 {EF) ”编辑 焉 ) 视图 W) 数据 局 ) 转换 [[) 分 析 (A) 直销 (M) ”图形 避 ) 实用 程序 (tt) 窗口 (NW) 帮助 


: rs el et z 描述 统计 
表 (T) 
比较 均值 (M) 
一 般 绪 性 模型 (G) 


广 兴 续 性 杭 型 7 419 77| 
:此 合 异 型 (X) ; 157.94 


相去 忆 ) 中 变量 ( 昌 ) 


Ea) 侗 相 关 (R). 
对 类 续 性 看 型 加 ) 


图 9-31 相关 性 分 析 窗 口 


步骤 四 : 设置 相关 性 分 析 变 量 。 在 弹出 的 相关 性 分 析 窗 口中 ， 将 默认 的 数值 型 变量 全 部 选中 (命令 为 Ctrl+A) ， 单 击 中 间 “ 箭 头 ” 按 钮 导 到 右 侧 “变量 ”区 域 ， 如 图 9-32 所 示 。 


围 双 变量 相关 


< 日 增 申 特 访客 


.多 每 次 访问 的 平均 搜索 . 
-六 每 灾 访 问 的 平均 页 面 . 
< 多 每 次 访问 逗留 时 间 
地 订单 转化 率 

少 投放 总 时 间 


- 相 天 杀 关 
Pearson Kerdall btaU-BK) [| Spearman 


性 理性 检验 
z 竣 便 检验 呆 ) 


单 们 检验 (L) 


标记 显著 性 相关 (F) 


图 9-32 ”设置 双 变 量 相关 性 


步骤 五 : 相关 性 解读 。 单 击 “ 确 定 ”按钮 后 ， 在 弹出 的 结果 窗口 中 ， 变 量 间 的 相关 性 关系 以 和 矩阵 的 形式 出 现 ， 如 图 9-33 所 示 。 以 第 一 行 数据 解读 为 利 ， 日 均 独 特 访 客 与 平均 注册 转化 率 、 平 均 注册 转化 
率 、 每 次 访问 的 平均 搜索 量 、 每 次 访问 的 平均 页 面 查看 次 数 、 每 次 访问 逗留 时 间 、 订 单 转化 率 、 投 放 总 时 间 的 相关 系数 分 别 为 -0.051、-0.073、-0.022、0.035、-0.045、-0.038。 变 量 间 的 相关 性 较 弱 ， 不 
存在 非常 强 的 相关 性 关系 。 


平均 注册 转 习 “| 每 过 访问 的 平 
日 均 捉 特 访 诈 Pearson 相 寺 性 1 .035 一 [045 
显著 性 【 驶 训 ) .297 .178 
由 899 987 889 


平均 注册 转化 率 Pearson 相关 性 .238 .106 220 


显著 性 【“ 汶 全 ) 
站 


每 次 访问 的 平均 搜索 量 Pearson 相关 性 
显著 性 深 介 ) 
四 

A Pearson 相 寺 性 
显著 性 【 汶 刘 ， 
上 


图 9-33 ”相关 性 结果 


ii 通过 变量 间 相 关 性 结果 还 可 以 做 数据 校 验 即 验 证 原始 数据 是 否 正 确 。 例 如 通常 情况 下 ， 流 量 越 高 ， 流 量 质 量 越 差 ， 表 现在 数据 中 是 当 Visit 或 UV 越 大 时 ， 相 关 转 化 类 指标 如 图 9-33 中 的 平均 注册 
转化 率 、 订 单 转化 率 等 指标 越 小 ， 越 呈现 负 相 关 的 关系 。 如 果 发 现 变量 间 关 系 不 符合 业务 经 验 ， 那 么 需要 仔细 验证 数据 中 是 否 存 在 异常 数据 或 错误 数据 。 另 外 ， 当 变量 间 相 关系 数 的 绝对 值 在 0.8 以 上 时 ， 需 


要 对 变量 进行 取舍， 如 Visit 和 UV 会 呈现 高 度 相 关 ， 此 时 我 们 只 保留 一 个 变量 作为 流量 数据 的 指标 即 可 ， 其 他 变量 原理 类 似 。 
(3) 数据 标准 化 


步骤 六 : 数据 标准 化 操作 。 依 次 选择 顶部 菜单 栏 “ 分 析 一 描述 统计 一 描述 ”， 在 弹 窗 的 描述 性 窗口 中 ， 将 左 侧 需 要 标准 化 的 数据 选中 并 导入 右 侧 的 变量 窗口 。 同 时 ， 选 中 “将 标准 化 得 分 男 存 为 变 
量 ” 选项， 再 单 击 “确定 ”按钮 ， 如 图 9-34 所 示 。 


5 日 均 种 特 访客 

侈 平均 主 册 转 化 率 

每 次 访问 的 平均 搜索 . 
必 每 次 访问 的 平均 页 面 . 


人 每 六 访问 吉 究 时 间 
地 订单 转化 率 
| 侈 投 就 总 时 间 


ly 将 标准 化 得 分 天 和 存 为 变量 加) 


图 9-34 “描述 性 ”设置 窗口 


步骤 七 : 数据 标准 化 结果 获取 。 数 据 标准 化 后 ， 在 原始 数据 窗口 中 ， 会 新 增 与 标准 化 变量 数量 相同 的 列 ， 但 数据 已 经 经 过 标准 化 。 字 段 名 称 开 头 默 认 新 增 字 母 Z， 意 思 是 已 经 经 过 2 标准 化 后 的 数据 ， 如 
图 9-35 所 示 。 


Z 每 屎 访问 的 平均 搜索 星 |z 每 屎 访问 的 


140*40 | .32865 1.72964 -08562 
140*40 ] ] .78768 .01796 
140*40 .24073 21193| 
140*40 1.82080 2.89746| 
140*40 42304 1.35130| 
140*40 3.85666 3.62534 
140*40 42304 51514 
140*40 .54459 | .22041 
140*40 72690 .13472| 


区 
东 
东 
东 
东 
二 
二 
东 


图 9-35 之 标准 化 后 的 数据 


rif 数据 标准 化 只 是 描述 性 统计 的 附加 功能 ， 在 “描述 ”功能 中 ， 核 心 功能 是 用 来 做 数据 均值 、 合 计 等 汇总 统计 、 标 准 差 、 方 差 、 极 值 等 离散 统计 以 及 峰 度 、 偏 度 等 分 布 统计 的 ， 这 些 都 是 数据 校 
验 和 审查 的 重要 途径 。 不 过 本 节 的 主要 目的 是 通过 PASW Statistics18 演 示 数 据 标准 化 和 相关 性 验证 ， 原 因 是 PASW Statistics 18 在 数据 处 理 上 的 便捷 性 更 佳 ， 因 此 更 适用 于 数据 处 理 过 程 。 在 实际 工作 中 ， 读 者 
可 根据 自身 对 工具 的 掌握 和 熟悉 程度 灵活 选择 。 


4. 初 步 分 析 


对 


该 步骤 中 ， 我 们 要 通过 Clementine 建 立 完整 数据 流 并 进行 初步 分 析 。 
步骤 一 : 保存 数据 文件 。 原 始 数 据 文件 保存 为 .txt 或 其 他 数据 文件 ， 以 便 Clementine 准 确 识别 。 本 例 中 在 桌面 新 建 一 个 名 为 “渠道 效果 聚 类 ”的 txt 文 档 ， 直 接 将 Exce 啤 k 据 粘贴 到 文档 中 并 保存 。 


步骤 二 : 新 增 数据 节点 。 单 击 Clementine 底 部 “可 变 文件 ”文件 节点 并 添加 到 ) 流 中 ， 双 击 节点 找到 桌面 “渠道 效果 聚 类 ”数据 文件 。 在 打开 的 设置 窗口 中 完成 以 下 关键 设置 。 


. 句 选 “ 读 取 文 件 中 的 字段 名 ”; 

“编码 ”设置 为 “UTF-8” ; 

" “ 定 界 符 ” 勾 选 “ 运 号 、 选 项 卡 、 新 行 ” 项 。 

设置 完成 后 ， 单 击 “ 刷 新 ”按钮 即 可 看 到 正确 识别 的 数据 ， 如 图 9-36 所 示 。 


步骤 三 : 新 增 统计 量 节 点 并 进行 相关 性 设置 。 单 击 底部 “输出 ”按钮 ， 将 “统计 量 ” 节 点 拖 入 流 中 。 双 击 该 节点 进入 设置 窗口 ， 点 击 “ 检 查 ”设置 并 将 数值 型 变量 选中 并 单 击 “确定 ”按钮 。 用 同样 的 
操作 将 “相关 ”设置 中 的 变量 设置 好 以 便 进行 相关 性 分 析 ， 如 图 9-37 所 示 。 


日 均 担 特 访 客 平均 主 册 转化 率 每 次 访问 的 平均 搜索 量 。 每 六 1 全 
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回 读 取 文件 中 的 字段 名 门 指 宇 字段 数 
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去 除开 头 和 结尾 的 空格 ; 加 无 门 左 门 右 口 两 者 


UTF-8 本 小数 社 呈 : 
| 定 界 符 


器 空 月 各 号 区 | 造山 卡 


OR | 
非 打印 中 字符 
| | 分 评 使 用 光 个 空 日 定 齐 全 


3 
EE 


| | 


图 9-36 ”设置 可 变 文件 


| 排序 方式 : 加 自 多 


蔬 
eo 


人 


] 统计 星 : 器 计数 ” 回 平 均值 回 总 数 是 
问 最 小 值 回 最 大 信 加 范围 


回 方差 回 标 准 差 回 平均 阐 | 
加 中 位 数 加 模式 : 


图 9-37 设置 相关 性 分 析 


步骤 四 : 相关 性 验证 。 设 置 完成 后 单 击 “ 执 行 ” 按 钮 ， 在 弹出 的 窗口 中 显示 了 不 同 数据 的 基本 统计 性 指标 以 及 相关 性 数据 ， 如 图 9-38 所 示 。 该 数据 与 通过 PASW Statistics 18 数 据 分 析 的 结果 一 致 。 


牢记 ET 避 生 成 


日- 和 
二 . 昱 计量 


每 次 访 占 的 平均 内 面 查 看 次数 
每 次 访 j 可 至 贸 时 间 
1] 单 转化 率 
拱 旗 总 时 间 

由 - 平 坪 主 册 转 化 率 


图 9-38 ”相关 性 验证 


步骤 五 : 设置 数据 审核 节点 并 进行 数据 校 验 。 将 底部 “输出 ”中 的 数据 审核 节点 添加 到 流 模型 的 “可 变数 据 ” 之 后 并 运行 ， 如 图 9-39 所 示 。 可 发 现 字段 间 的 数据 差异 较 大 (实际 上 广告 投放 数据 的 确 如 
此 ) 。 例 如 日 均 独 特 访客 最 高 值 为 25294.77， 最 小 值 仪 为 0.06 (数据 虽然 经 过 一 定 的 处 理 ， 但 仍然 反馈 出 量 级 差异 ) 。 最 重要 的 是 其 中 每 次 访问 逗留 时 间 仅 有 887 个 有 效 值 ， 缺 失 了 两 个 字段 值 。 不 过 ， 我 
们 此 次 使 用 的 聚 类 分 析 对 于 缺失 值 的 要 求 并 不 严格 ， 因 此 这 里 不 做 数据 处 理 ， 但 如 果 缺 失 值 过 多 ， 需 要 通过 一 定 的 方法 将 缺失 值 进行 修补 ， 如 使 用 均值 、 中 位 数 甚至 直接 丢弃 等 ， 具 体 根 据 数 据 的 数量 以 及 
业务 场景 来 定义 。 


[13 个 字 限 ] 的 数据 审核 #2 


3xr Dm 04m 国 加 可 国生 辣 
类 型 


字段 | 最 小 值 最 大 值 平均 值 


区 | 渠 赴 亿 三 值 过 订 学 离散 


窑 日 均 挤 特 访客 地 范围 DOD6DI 25294.770 340.847 1634.410 


坊 平均 主 册 转 .… < 他 范围 


化 每 次 访问 的 .… 好 范围 


地 每 次 访问 的 .… 


窗 每 次 访问 到 .… FE 4450.830 262.669 224.365 


局 订 单 转化 享 


元; 投放 总 时 间 | NH : 30.000 


图 9-39 ”数据 审核 结果 
蝶 由 析 数据 审核 不 仅 能 帮助 我 们 进行 数据 校 验 ， 还 可 以 为 之 后 的 数据 挖掘 提供 条 件 ， 如 在 聚 类 分 析 中 ， 如 果 使 用 区 均值 法 ， 极 值 差异 性 较 大 会 严重 影响 聚 类 效果 。 


步骤 六 : 设置 全 局 变量 。 设 置 全 局 变量 的 目的 是 为 后 面 做 数据 标准 化 指定 全 局 均值 、 方 差 等 做 准备 ， 这 些 值 是 进行 标准 差 运 算 的 基础 。 将 “输出 ”中 的 全 局 变量 节点 拖 入 流 中 ， 连 接 到 可 变 文件 之 后 。 
双击 打开 全 局 变量 设置 节点 并 从 可 用 字段 集中 选择 要 标准 化 的 变量 ， 设 置 完成 后 如 图 9-40 所 示 。 确 认 其 中 MEAN (均值 ) 、 标 准 差 已 被 勾 选 ， 再 单 击 “ 执 行 ” 按 钮 即 可 。 
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EE 
EE 
加 图 国 本 本 


图 9-40 设置 全 局 变量 


步骤 七 : 设置 导出 节点 并 进行 数据 标准 化 。 在 底部 “字段 选项 ”中 选择 导出 节点 ， 使 其 连接 到 可 变 文 件 之 后 。 双 击 打开 导出 节点 ， 依 次 进行 以 下 设置 : 
` 将 “模式 ”设置 为 多 个 ， 目 的 是 要 对 多 个 值 进行 处 理 。 
. 在 可 选 数据 集中 选中 要 标准 化 的 字段 。 
* 字段 名 扩展 设置 为 “前 级 ”， 并 在 值 中 填 入 Z_， 目 的 是 为 了 更 好 的 标志 字段 。 


. 在 公式 中 框 中 填 入 以 下 公式 :，(@FIELD-@GLOBAL MEAN (@FIELD) ) /@GLOBAL SDEV (@FIELD) ， 其 中 @FIELD 代 表 了 各 字段 的 值 ; @GLOBAL MEAN (@FIELD) 代表 各 字段 的 平均 


值 ; @GLOBAL SDEV (@FIELD) 代表 各 字段 的 标准 差 ， 从 而 衍生 出 标准 差 计算 公式 。 设 置 完成 后 如 图 9-41 所 示 。 


司 8 


泳 加 为 : 站 后 过 名前 幼 
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图 9-41 ”数据 标准 化 设置 


步骤 八 : 数据 标准 化 验证 。 为 了 验证 数据 是 否 正确 标准 化 ， 在 导出 节点 后 新 增 表格 节点 ， 并 运行 。 在 原始 数据 表 后 新 增 了 标准 化 后 的 数据 列 ， 以 Z_ 开 头 命 名 ， 该 数据 与 通过 PASW Statistics 18 计 算 的 
数据 一 致 ， 如 图 9-42 所 示 。 


表 ( 20 个 字 盘 ,889 条 记 录 ) #3 
[引文 件 二] 编辑 


图 9-42 ”标准 化 运算 结果 


步骤 九 : 添加 过 滤 节 点 并 过 渡 字段 。 为 了 减少 原始 数据 字段 的 干扰 ， 新 增 过 滤 节 点 并 将 原始 数据 中 的 日 均 独 特 访问 等 变量 过 滤 掉 。 将 “字段 选项 ”中 的 过 渡 节 点 添加 到 Zz 标准 化 节点 (导出 ) 之 后 ， 双 击 
打开 将 原始 的 日 均 独 特 访客 等 指标 过 滤 掉 ， 如 图 9-43 所 示 。 
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图 9-43 ”过 滤 字 段 
贸 小 和 站 如 何 一 次 性 过 滤 多 个 字段 ? 首先 选中 第 一 个 字段 ， 然 后 按 住 Shift 键 的 同时 选择 最 后 一 个 字段 (如 果 是 不 连续 字段 则 按 住 Ctd 键 选择 ) ， 单 击 其 中 的 任何 一 个 箭头 即 可 一 次 性 过 滤 所 选 字 段 。 


步骤 十 : 添加 类 型 。 在 过 滤 节 点 之 后 新 增 类 型 节点 ( 聚 类 分 析 必 须 指定 数据 类 型 ， 否 则 流 会 报错 ) ， 双 击 打开 节点 后 单 击 “ 读 取 值 ”按钮 ， 如 图 9-44 所 示 。 
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图 9-44 添加 类 型 


经 过 以 上 步骤 ， 聚 类 分 析 前 期 准备 的 基本 分 析 工 作 完成 了 ， 下 面 进入 聚 类 分 析 阶 段 。 


步骤 十 一 : 添加 聚 类 节点 。 在 类 型 节点 之 后 添加 “两 步 ” 和 “K-Means” 两 种 聚 类 方法 (在 “ 建 模 - 细 分 ”中 可 找到 ) 。 对 于 初次 进行 聚 类 分 析 ， 可 使 用 “两 步 ” 聚 类 进行 初步 分 析 ， 好 处 在 于 无 需 指 
聚 类 数 并 可 通过 标准 化 字段 、 排 除 离 群 值 等 设置 来 排除 数据 集中 的 异常 值 对 聚 类 效果 的 影响 ， 如 图 9-45 使 用 了 “两 步 ” 聚 类 。 
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图 9-45 ”两 步 聚 类 设置 


步骤 十 二 : 两 步 聚 类 结果 分 析 。 人 在 设置 完成 后 单 击 “ 执 行 ” 按 钮 ， 待 运算 完成 后 将 右上 角 模 型 窗口 中 的 运算 结果 拖 入流 中 ， 可 双击 查看 聚 类 结果 。 图 9-46 所 示 为 两 步 聚 类 结果 。 
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图 9-46 “两 步 ” 聚 类 结果 


如 何 评 估 聚 类 结果 
聚 类 属于 典型 的 无 监督 学 习 ， 因 此 不 存在 统一 的 度量 来 判断 聚 类 结果 的 好 与 坏 。 通 常情 况 下 会 通过 以 下 方法 进行 结果 评估 : 


* 不 同类 别 的 样本 量 。 好 的 聚 类 结果 不 同类 别 间 样 本 量 差异 性 较 小 ， 如 果 图 9-46 中 茶 个 类 别 样本 量 占 比 超过 80%， 其 他 分 类 由 于 样本 量 过 低 导 致 数据 结果 可 信和 度 降低 。 


不 符合 业务 的 应 用 实际 。 比 如 业务 方 认 为 跳出 率 是 衡量 渠道 的 最 重要 特征 之 一 ， 在 分 类 中 一 定 要 有 至 少 一 个 渠道 以 跳出 率 作为 突出 特征 的 变量 。 


` 可 解读 性 。 聚 类 结果 的 最 终 目的 是 通过 解读 提供 一 定 的 数据 价值 和 洞察 力 ， 如 果 数据 聚 类 很 难 发 现 突出 特征 ， 意 味 着 聚 类 效果 难以 解读 和 应 用 。 


` 除 此 之 外 ， 还 有 通过 计算 Cophenetic 相 关系 数 、DB 指 数 、SD 有 效 性 系数 等 方法 进行 数据 验证 ， 由 于 这 些 方法 过 于 理论 化 ， 因 此 并 不 适合 普通 用 户 使 用 。 
5. 深 入 分 析 


通过 以 上 步骤 进行 的 数据 聚 类 ， 得 出 了 相应 的 聚 类 结果 ， 在 本 阶段 进行 数据 解读 工作 。 下 面 以 两 步 聚 类 结果 为 例 进行 介 


系统 将 数据 集 分 为 5 类 ， 每 个 类 别 数 据 数量 依次 为 150、67、129、325、216 ( 注 : 原始 数据 记录 为 889 条 ， 分 类 后 的 数据 供 887 条 ， 其 中 两 条 记录 由 于 缺失 而 被 丢弃 ) 。 


` 业务 经 验 。 虽 然 没 有 预先 设 定 的 类 别 标准 ， 但 业务 对 于 数据 会 有 基本 的 判断 方向 。 例 如 业务 可 能 认为 某 些 指标 具有 显著 的 业务 价值 ， 那 么 在 分 类 结果 中 的 菜 些 类 别 一 定 


. 聚 类 -1 的 特征 是 : Z_ 转 化 率 为 -0.025; Z_ 每 次 访问 的 平均 搜索 量 为 -0.117; Z_ 每 次 访问 的 平均 页 面 查看 次 数 为 -0.019; Z_ 每 次 访问 过 留 时 间 为 -0.118; Z_ 平 均 注册 转化 率 为 0.315; Z 日 均 独 特 访客 为 - 


0.195; Z_ 投 放 总 时 间 为 -0.043; 65.33% 的 广告 尺寸 为 308 X388 像 素 ; 97.33% 的 广告 类 型 为 banner; 82% 的 广告 卖点 是 满 减 ; 合作 方式 为 CPC; 素材 类 型 为 JPG。 
全 注意 其 中 的 数据 为 平均 值 ， 且 是 经 过 乙 标准 化 后 的 数据 ， 后 期 需要 根据 原始 数据 对 应 表 进 行 还 原 处 理 。 通 过 Vlookup 等 其 他 方式 进行 匹配 即 可 还 原 数据 。 


:以 同样 的 电路， 其 余 四 类 特征 都 可 以 陈述 出 来 。 两 步 聚 类 结果 ， 如 图 9-47 所 示 。 
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图 9-47 两 步 聚 类 结果 
为 了 进一步 明确 各 类 别 的 特征 ， 单 击 聚 类 结果 中 的 “查看 器 ”进行 图 形 可 视 化 分 析 。 为 了 方便 解读 ， 单 击 顶 部 图 形 切 换 按 钮 ， 将 图 形 转换 为 如 图 9-48 所 示 的 效果 。 


图 形 化 强化 的 不 同类 别 的 视觉 特征 ， 如 聚 类 -4 (第 一 行 ) 中 ， 平 均 注册 转化 率 、 日 均 独 特 访客 、 每 次 访问 的 平均 搜索 量 、 每 次 访问 的 平均 页 面 查看 次 数 、 每 次 访问 的 逗留 时 间 以 及 订单 转化 率 较 高 ， 表 
现在 图 中 是 柱 形 图 明显 高 于 其 他 类 别 。 但 在 合作 方式 、 广 告 卖点 等 方面 没有 明显 的 突出 特征 (其 中 每 个 类 别 或 指标 都 可 双击 查看 细节 ) 。 同 理 ， 其 他 类 别 都 有 各 自 突出 的 特征 。 


以 上 通过 数据 和 指标 进行 的 数据 解读 ， 可 使 用 业务 方 通俗 易 懂 的 语言 翻译 为 (以 聚 类 -4 为 例 ) : 该 类 别 属于 高 质量 的 广告 渠道 ， 表 现在 该 类 别 渠道 的 流量 数量 和 流量 质量 较 高 ， 但 这 些 渠道 在 广告 素材 
告 类 型 、 合 作 方式 、 广 告 尺寸 、 广 告 卖点 均 没有 明显 特征 ， 另 外 广告 投放 时 间 也 不 明显 。 这 类 渠道 属于 A 类 高 效 渠 道 ， 应 该 重点 关注 。 


通过 以 上 解读 ， 可 将 每 个 类 别 数据 价值 及 其 类 别 特征 提炼 出 来 ， 但 为 了 业务 的 下 一 步行 动 ， 通 常 我 们 需要 将 聚 类 结果 导出 以 便 进 行 深入 沟通 和 落地 工作 : 


第 二 步 : 新 增 表 节点 并 连接 到 两 步 聚 类 结果 ; 
第 三 步 : 双击 打开 表 节 点 ， 选 择 “ 文 件 一 导出 ”功能 ， 再 选择 合适 的 格式 进行 保存 。 完 整 的 数据 流 模 型 及 导出 模型 ， 如 图 9-49 所 示 。 


本 书 提供 了 该 模型 的 数据 流 ， 具 体 见 随 书 资源 文件 “渠道 效果 聚 类 流 ”。 聚 类 分 析 典 型 的 落地 动作 如 下 : 


“ 针对 特定 类 别 的 数据 提取 。 如 聚 类 -4 是 业务 方 认为 较 好 的 分 类 结果 ， 在 提炼 其 特征 时 ， 可 将 聚 类 -4 设置 标志 ， 并 使 用 决策 树 进行 特征 提取 。 
. 特定 渠道 的 针对 性 优化 。 如 聚 类 -1 的 广告 卖点 主要 是 “ 满 减 ”， 针 对 这 一 类 别 的 渠道 在 操作 时 可 适合 考虑 满 减 的 突出 性 。 


* 寻找 重点 优化 对 象 。 如 聚 类 -3 除了 投放 时 间 长 之 外 ， 其 他 数据 指标 均 较 低 ， 因 此 可 以 考虑 将 该 类 别 的 渠道 作为 重点 优化 对 象 。 
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图 9-49 ”完整 的 数据 流 及 时 出 模型 


9.4.4 ”营销 效果 分 析 
1. 专 题 背 景 
营销 效果 分 析 是 每 个 公司 数据 部 门 的 重要 工作 ， 本 节 针 对 广告 效果 评估 进行 案例 演示 。 
2. 前 期 沟通 
广告 效果 评估 一 般 是 固定 需求 ， 即 每 次 广告 活动 结束 之 后 都 会 进行 的 规律 性 工作 。 针 对 这 一 需求 的 前 期 沟通 需要 数据 部 门 了 解 以 下 几 个 问题 
. 第 一 个 问题 广告 投放 形式 、 时 间 、 网 站 、 着 陆 页 、 标 记 、 素 材 等 业务 操作 细节 
. 第 二 个 问题 : 广告 目标 或 推广 目的 。 
. 第 三 个 问题 : 效果 评测 指标 。 
供 解 折 第 一 个 问题 是 是 为 了 解决 效果 评估 基本 数据 要 素 的 确认 ， 后 两 个 问题 一 起 构成 了 广告 效果 评估 目标 的 确认 以 及 如 何 评估 的 问题 ， 是 本 专题 的 重 中 之 重 。 


经 过 沟通 ， 第 一 个 问题 已 经 非常 明确 ; 第 二 个 问题 的 结论 是 要 通过 本 次 推广 ， 在 增加 网 站 流量 的 同时 提高 全 站 销售 效果 ; 第 三 个 问题 在 讨论 时 出 现 了 分 歧 : 按照 公司 要 求 所 有 营销 环节 只 评估 流量 与 销 
售 ， 但 不 同 渠 道 对 于 这 两 方面 的 贡献 侧重 点 不 同 。 如 广告 类 渠道 在 流量 类 贡献 有 优势 ， 而 SEM 类 在 订单 类 贡献 价值 更 高 。 因 此 ， 需 要 一 套 能 兼顾 公司 整体 目标 和 各 推广 模块 个 体 作用 的 全 面 指标 与 度量 体 
系 。 


镶 解 折 “营销 亲 道 间 的 贡献 差异 是 基本 事实 ， 因 此 需要 兼顾 企业 目标 与 渠道 的 特殊 情况 进行 综合 评估 。 
针对 第 三 个 问题 ， 数 据 分 析 师 与 业务 部 门 经 过 多 次 沟通 达成 以 下 共识 : 


数据 基本 指标 选择 全 站 所 有 渠道 共有 的 基础 指标 ， 捐 弃 渠 道 自身 特有 的 站 外 指标 ; 如 新 媒体 ( 微 博 等 ) 渠道 的 转发 量 、 评 论 量 是 其 他 渠道 所 不 具有 的 ， 因 此 在 全 站 统一 数据 汇总 时 不 子 采 用 ， 但 该 指 
标 可 作为 模块 自身 效果 评估 时 的 参考 指标 使 用 。 


. 将 基础 指标 按照 类 型 进行 归 类 并 划分 为 流量 类 、 会 员 类 、 销 售 类 三 种 ， 不 同 模 块 按照 各 自 属性 进行 权重 划分 ， 并 以 标准 化 后 的 数据 进行 加 权 求 和 ， 最 后 得 出 统一 度量 值 进 行 评比 。 
和 组 析 标准 化 和 加 权 是 处 理 不 同 维度 间 由 于 指标 权重 差异 而 无 法 对 比 的 基本 方法 ， 加 权 后 得 出 的 汇总 值 可 以 更 好 地 反映 不 同 指标 的 综合 效果 ， 利 于 做 差异 性 比较 。 


经 过 反复 沟通 ， 不 同 营 销 模 块 的 价值 贡献 作用 如 下 。 


氏 解 折 “以 上 6 个 模块 是 公司 的 国定 划分 ， 各 个 模块 内 部 的 价值 排序 也 是 各 模 决 负责 人 自身 划分 的 结果 ， 但 这 仍然 无 法 量化 ， 因 此 不 具备 操作 性 。 权 重量 化 工作 会 在 下 文 初步 分 析 中 开展 ， 数 据 部 门 会 
先 提供 给 业务 负责 人 一 些 数据 局 发， 然后 有 针对 性 地 进行 权重 评定 而 非 拍 脑 袋 决策 。 


3 .数据 准备 
在 本 阶段 ， 我 们 需要 完成 营销 效果 分 析 的 数据 准备 工作 ， 基 础 数据 包括 三 部 分 : 
一 是 营销 投放 期 间 全 站 的 基本 数据 ， 包 括 预期 全 站 流量 与 实际 流量 对 比 。 
“ 二 是 营销 投放 效果 数据 ， 包 括 各 模块 汇总 数据 及 指标 、 模 块 计划 完成 度数 据 。 
. 三 是 各 模块 投放 物料 与 基本 效果 数据 ， 包 括 各 模块 详细 投放 媒体 与 位 置 细 分 数据 、 效 果 评 分 指标 。 


值得 关注 的 是 ， 通 常 在 营销 类 效果 评估 过 程 中 ， 很 少 考虑 订单 有 效 性 的 问题 ， 即 营销 端 已 经 完成 的 订单 中 有 多 大 比例 是 有 效 状态 下 的 订单 (有效 状 态 的 定义 是 排除 无 效 订单 如 取消 、 作 废 等 ) 。 在 本 次 
营销 效果 评估 过 程 中 ， 我 们 将 引入 “有 效 订单 ”的 概念 ， 以 便 从 公司 角度 评测 营销 渠道 的 真实 订单 效果 。 


人 fpf 有效 订 单 是 企业 产生 利润 的 前 提 ， 营 销 由 于 处 于 公司 运营 的 前 端 ， 只 能 将 用 户 引入 并 闽 激 其 下 单 ， 但 对 于 用 户 下 单 后 是 否 能 完成 交易 不 具有 控制 性 ， 因 此 对 于 营销 分 析 很 少 涉及 后 端 订单 的 有 
效 性 。 实 际 上 ， 站 在 公司 的 角度 ， 无 论 是 企业 内 部 哪个 环节 出 了 问题 都 会 导致 利润 无 法 产生 ， 只 有 以 真实 、 有 效 的 订单 数据 进行 核算 才 符 合 公司 的 最 大 利益 。 另 外 ， 订 单 有 效 性 也 是 评估 渠道 效果 的 重要 指 
标 ， 尤 其 对 于 恶意 订单 评估 意义 重大 。 建 议 读者 在 做 营销 效果 评估 时 ， 尽 量 以 真实 、 有 效 的 订单 数据 为 前 提 进 行 数据 分 析 和 探究 。 


此 阶段 的 数据 准备 工作 涉及 网 站 分 析 系 统 与 会 员 系 统 、 订 单 系统 、 交 易 系 统 的 数据 整合 ， 具 体 细节 在 此 略 过 ， 数 据 结果 见 本 书 配套 资源 文件 。 对 于 大 型 营销 活动 而 言 ， 数 据 准备 工作 极为 复杂 并 且 耗 


时 ， 但 这 部 分 工作 是 必须 目 非常 重要 的 ， 如 果 前 期 数据 出 现 问 题 会 影响 后 期 整个 分 析 工 作 ， 因 此 需要 读者 引起 重视 ， 拒 绝 “垃圾 近 、 垃 圾 出 ”。 


~ 


4. 效 果 分 析 


营销 效果 分 析 思 路 具有 通用 性 ， 基 本 流程 是 : @ 分 析 公 司 整体 预期 与 实际 发 生 结果 的 差异 性 以 及 影响 效果 的 关键 点 ; @ 分 析 各 渠道 预期 与 实际 效果 ; @ 分 析 各 渠道 具体 数据 ， 并 找到 此 次 投放 和 操作 过 
程 中 的 优 劣 得 失 ; @ 营 销 渠道 效果 排名 与 价值 趋向 ; @@ 整 体 总 结 与 效果 建议 。 


(1) 分 析 公 司 整体 预期 与 实际 发 生 结果 的 差异 性 以 及 影响 效果 的 关键 点 

针对 营销 预期 与 实际 数据 ， 具 体 分 析 结 果 如 下 。 

` 流量 节奏 : 本 月 日 均 流量 为 6987， 工 作 日 日 均 流量 为 8203， 休息 日 日 均 流量 为 5992 万 ,峰值 (18 号 主 活动 开展 当天 ) 为 1003; 流量 来 源 主要 为 广告 类 和 BD， 整 体 流量 占 比 分 别 为 52%、24%。 
. 花费 节奏 : 本 月 总 花费 为 73150 元 ， 主 要 费用 渠道 为 线 上 媒介 (包括 线 上 广告 和 门户 占 比 47%) 、BD ( 占 比 32%) ; 整体 营销 每 次 访问 成 本 为 0.41 元 。 


. 营销 节奏 : 本 月 营销 订单 转化 率 为 0.93%， 客 单价 1112 元 ,日 均 订 单 量 52， 每 订单 成 本 为 47 元 。 新 增 中 注册 人 数 86 人 ， 其 中 产生 购物 的 用 户 比 例 为 48.7%。 总 购物 会 员 数 为 415 人 ， 当 月 复 购 率 为 25%。 
全 站 计划 与 实际 访问 量 趋势 ， 如 图 9-50 所 示 。 


(2) 分 析 各 渠道 预期 与 实际 效果 


. 费用 控制 : 整体 营销 实际 费用 73150 元 ， 控 制 在 计划 费用 以 内 ，SEM 费 用 超过 计划 11%。 


全 站 计划 与 实际 访问 量 趋势 


一 一 计划 全 站 访问 数 ”一 -一 全 站 实际 访问 数 


1234567 8 9 101112131415161718192021222324252627282930 


图 9-50 全 站 计划 与 实际 访问 量 趋势 图 
流量 目标 : 整体 营销 访问 量 为 180050， 超 额 完 成 15%。 
成 本 目标 : 整体 营销 访问 成 本 为 0.41 元 ， 仅 为 预期 成 本 的 84% (预期 流量 成 本 为 0.49 元 ) 。 


整体 来 看 ， 在 较 好 的 流量 费用 与 流量 成 本 的 控制 下 ， 营 销 超 额 完成 预期 目标 。 但 细 分 各 模块 ，SEM 费 用 超出 预期 ;CPS 和 会 员 营 销 流量 分 别 完 成 63% 和 55%， 且 CPS、 新 媒体 和 会 员 营 销 每 次 访问 成 本 
控制 较 弱 ， 尤 其 是 会 员 营 销 的 访问 成 本 距离 预期 较 远 。 具 体 数据 如 表 9-13 所 示 。 


表 9-13 ”营销 计划 与 完成 度 细 分 数据 


每 次 访问 成 本 
于 和 字 — 全 | 5 和 和 


实际 


成 本 /元 | 成 本 /元 


除 以 上 计划 与 预期 数据 外 ， 数 据 部 门 还 通过 部 分 站 外 数据 对 比 与 分 析 ， 获 得 公司 在 整体 市 场 中 的 角色 变化 与 传播 声音 ， 具 体 包 括 : 


. 通过 专业 市 场 调研 数据 、Alexa 等 获得 流量 覆盖 数据 。 

“ 通过 线 上 广告 平台 获得 品牌 曝光 数据 。 

" 通过 微 博 等 获得 曝光 、 参 与 、 转 发 和 用 户 参 与 数据 。 

总 结 来 看 ， 营 销 效 果 侧重 点 可 分 为 四 个 方面 : 品牌 曝光 、 流 量 引入 、 会 员 转 化 、 在 线 销售 。 

(3) 分 析 各 渠道 具体 数据 ， 并 找到 此 次 投放 和 操作 过 程 中 的 优 劣 得 失 

这 部 分 内 容 是 营销 效果 分 析 的 主要 构成 部 分 ， 同 时 也 是 面向 营销 内 部 决策 和 执行 对 象 的 关键 价值 点 ， 该 模块 要 按照 营销 模块 分 别 展开 讨论 和 分 析 。 限 于 篇 幅 ， 本 节 将 挑选 重点 模块 进行 分 析 。 
首先 进行 营销 效果 汇总 。 


营销 效果 汇总 的 目的 是 获得 关于 营销 整体 效果 的 细节 数据 和 结论 ， 要 针对 这 一 问题 进行 分 析 ， 首 先 我 们 需要 下 结论 ， 即 该 月 份 效 果 除 了 是 否 完成 预期 外 ， 其 他 数据 点 是 否 有 显著 意义 ; 同时 ， 虽然 完成 
预期 但 是 环比 和 同比 情况 是 否 也 同样 出 色 ? 


针对 本 案例 ， 我 们 选取 上 个 月 进行 数据 对 比 并 得 出 以 下 结论 ， 数 据 如 表 9-14 所 示 。 


表 9-14 营销 效果 汇总 数据 
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整体 效果 : 日 均 流量 突破 6000， 较 上 个 月 翻 三 倍 ， 峰 值 突破 10000; 与 此 同时 ， 流 量 成 本 仅 增 加 了 119。 


ai 结论 侧重 于 两 方面 : 流量 和 流量 成 本 ， 在 营销 效果 评估 过 程 中 ， 完 全 由 营销 负责 的 部 分 (或 营销 应 该 负 全 责 的 部 分 ) 只 有 流量 数据 与 流量 成 本 ， 因 此 这 里 针对 这 两 部 分 直接 点 明 。 为 什么 流量 
成 本 增加 在 这 里 是 偏向 讲义 的 表达 ? 很 多 企业 往往 错误 地 认为 ， 每 天 1000 访 问 量 与 10000、1000000 流 量 成 本 相同 ， 并 以 此 估算 营销 费用 。 但 做 过 大 型 营销 分 析 的 读者 会 有 这 样 的 经 验 ， 当 流量 规模 越 大 时 ， 
流量 的 获取 成 本 和 采 买 难度 越 高 ， 因 此 不 同 量 级 的 访问 成 本 也 不 在 同一 个 层级 上 。 本 案例 中 ， 流 量规 模 增 加 3 倍 ， 但 流量 成 本 只 增加 11% 显 示 出 了 非常 高 的 成 本 控制 能 力 。 针 对 新 手 ， 通 常 有 两 种 方法 进行 流 
量 成 本 测量 : 一 是 根据 历史 数据 建立 流量 数量 与 流量 成 本 的 预测 模型 ， 通 过 该 模型 可 以 预测 出 在 一 定 规模 下 的 成 本 预期 ; 二 是 根据 历史 经 验 进 行 判 断 。 


以 下 是 原因 剖析 : 

. 营销 点 创新 。 根 据 公 司 的 实际 情况 及 消费 者 被 促销 时 的 反馈 ， 从 单纯 做 低 价 促销 到 特色 营销 X (此 处 省 去 了 促销 点 名 称 ) ， 给 消费 者 新 的 冲击 ， 在 线 上 和 线 下 引起 广泛 关注 及 活动 评论 。 
" 费用 优化 。 为 实现 本 月 流量 计划 ， 增 加 广告 的 投入 (由 33% 提 高 到 54%) ， 削 减 SEM 等 其 他 渠道 的 费用 支出 ， 寻 致 整体 流量 大 幅 增长 的 同时 ， 访 问 成 本 增长 较 小 。 

媒体 组 合 。 硬 广 增加 A5， 访问 成 本 为 0.3 元 ,日 均 流量 超过 150000; 导航 增加 S3 名 站 飘红 ,访问 成 本 为 0.5 元 ,但 ROI 高 达 95; BD 增加 B7 (合作 资源 ) ， 通 过 优质 合作 引入 更 多 精准 会 员 。 
媒介 优化 。 根 据 不 同 平台 特点 有 针对 性 地 选择 广告 单 品 ， 在 大 平台 (如 A2) 更 换 频 率 更 高 ， 保 持 高 活动 曝光 率 。 


跨 部 门 协作 增加 。 选 择 广 告 商品 时 ， 媒 介 和 采 销 根据 数据 反馈 ， 共 同 沟通 推广 商品 ; 广告 创意 时 ， 媒 介 和 设计 共同 沟通 广告 诉求 和 设计 要 素 ; 数据 反馈 实时 性 增加 ， 数 据 部 门 每 天 发 送 实 时 数据 报 
告 ， 针 对 活动 策划 重要 环节 进行 把 关 和 效果 跟踪 ， 并 及 时 反馈 数据 。 


Oa ; 读者 可 以 发 现 ， 以 上 的 数据 分 析 不 只 是 包含 数据 探 完 ， 更 多 的 是 广告 策略 及 跨 部 门 协 作 流程 优化 ， 这 种 分 析 场 景 尤其 在 大 型 广告 活动 、 跨 部 门 协 作 或 公司 级 重要 事件 中 尤为 明显 。 作 为 数据 从 
业者 ， 不 仅 要 能 看 到 数据 带 来 的 定量 价值 ， 更 要 能 从 整体 出 发 ， 结 合 定性 或 市 场 战略 进行 效果 分 析 ， 即 数据 与 业务 经 验 两 条 腿 走 路 。 


但 与 此 同时 ， 我 们 也 看 到 一 些 渠 道 的 订单 有 效率 较 低 ， 如 CPSs 渠 道 订单 有 效率 仅 为 66%、BD 仅 为 67%， 广 告 和 新 媒体 也 没有 超过 70% ， 说 明 这 些 渠 道 存在 一 定 的 废 单 情况 ， 且 比重 较 大 。 
其 次 是 各 模块 效果 分 析 。 

不 同 模块 除了 通用 指标 和 思路 的 分 析 维 度 外 ， 还 包括 一 些 特殊 维度 或 注意 点 ， 例 如 : 

` 每 个 模块 中 的 流量 支柱 需要 重点 分 析 ， 葛 用 最 大 或 流量 最 高 的 几 个 细 分 模块 需要 重点 关注 其 流量 数量 、 流 量 成 本 、 流 量 质量 等 。 
“SEM 需要 细 分 品牌 区 与 关键 字 效 果 ， 关 键 字 需 品牌 词 与 非 品 牌 词 。 

* 广告 类 效果 存在 较 大 的 作 次 可 能 性 ， 尤 其 是 联盟 广告 投放 类 媒体 ， 细 分 着 陆 页 指标 (进入 次 数 、 跳 出 率 、 停 留 时 间 、 平 均 访 问 次 数 ) 、 路 径 、 页 面 热力 图 、 关 键 汤 斗 可 以 找到 异常 作 商 点 。 


* 返 佣 类 、 返 利 类 渠道 订单 作 产 可 能 性 较 大 ， 且 由 于 其 佣金 结 萌 通 常 大 大 灌 后 于 营销 推广 〈 通 常 是 30 天 之 后 ) 、 流 量 监测 由 于 跳 转 而 数据 丢失 等 问题 ， 其 关注 点 是 订单 效果 、 订 单 有 效 性 、 与 其 他 渠道 
订单 交叉 分 析 。 


新 媒体 如 微 博 、 微 信 的 粉丝 数量 与 质量 评估 需要 兼顾 ， 大 量 僵 尸 粉 无 法 给 企业 带 来 任何 品牌 和 销售 上 的 贡献 。 

除了 对 于 结果 的 解读 外 (下 结论 和 原因 分 析 ) ， 挖 掘 渠 道 特征 也 是 大 型 广告 投放 后 的 重要 部 分 。 以 下 是 针对 某 个 渠道 的 特征 分 析 。 

典型 用 户 (订单 用 户 ) 特征 包括 : 

` 关注 活动 。 着 陆 页 主要 为 首页 ， 下 一 步行 为 主要 为 专题 活动 页 ， 流量 占 比 为 20%， 比 全 站 平均 水 平 高 82%。 

“ 茶 导 航 猜 你 喜欢 产品 需求 较为 生活 化 。 生 活 电器 、 厨 卫 电 器 购买 量 最 高 ， 如 电 吹 风 、 豆 浆 机 、 痢 须 刀 等 ， 食 品 酒水 和 女士 箱包 需求 较 高 ; 平均 客 单价 为 129 元 ， 比 全 站 低 31%。 
. 对 团购 促销 不 敏感 。 团 购 频 道 浏览 量 占 比比 全 站 低 5%， 团 购 商 品 占 比 仅 为 22% (全 站 为 33%) 。 

“ 老 客 户 占 比 高 。81.6% 用 户 为 老 用 户 ， 闪 电 购 使 用 率 14% (全 站 为 9%) 。 

营销 机 会 制定 针对 老 客 户 的 营销 策略 ， 包 括 : 

" 某 导 航 猜 你 喜欢 关键 字 投 放 时 ， 增 加 对 日 常生 活 类 产品 关键 字 的 投放 ， 产 品 特征 是 : 价格 较 低 、 日 常用 品 、 折 扣 力 度 较 大 、 女 士 服饰 箱包 用 品 。 

分 利用 免费 资源 板块 ， 利 用 活动 增加 对 用 户 的 曝光 。 
.研究 投放 的 最 优化 曲线 ， 寻 找 最 优 的 费用 、 访 问 量 和 成 本 点 ， 为 日 后 广告 费用 预算 做 准备 。 


乱 乌 折 如 何 寻 找 用 户 特征 ?在 9.3 节 中 提 到 用 户 特征 分 为 属性 特征 和 行为 特征 ， 这 些 特征 在 落地 时 可 以 作用 于 企业 内 部 运营 的 重要 节点 ， 包 括 : 价格 调节 、 促 销 方 式 优 化 、 站 内 着 陆 页 吸引 、 主 页 面 
引流 和 流程 优化 、 产 品 选择 、 最 新 需求 趋势 、 广 告 卖 点 与 诉求 调整 等 。 因 此 ， 在 落地 型 分 析 报 告 中 ， 需 要 将 渠道 特征 、 用 户 属性 与 后 期 执行 结合 起 来 ， 要 商业 团结 找到 落地 执行 点 。 


接 下 来 分 析 新 增 渠 道 或 重点 关注 渠道 的 效果 。 
在 每 次 营销 推广 活动 中 ， 对 于 新 增 广告 或 合作 媒体 的 效果 评估 是 必 备 工作 。 以 下 是 针对 新 增 A5 和 A14 媒 体 效 果 的 评估 ， 数 据 如 表 9-15 所 示 。 


A5 访 问 量 较 高 且 占 广告 整体 访问 量 的 149% ， 其 流量 成 本 仅 为 0.23 元 ， 因 此 具有 较 好 的 引流 能 力 ; 其 转化 率 、 每 订单 成 本 具有 一 定 的 优势 ， 唯 一 不 足 的 是 ROI 较 低 〈 仪 为 0.4) 。 该 媒体 平均 客 单价 仅 为 19 
元 ， 大 大 低 于 广告 整体 ( 客 单价 为 343 元 ) 。 由 于 投放 天 数 较 少 ， 且 为 新 合作 媒体 ， 效 果 需 要 持续 观察 。 


A14 每 次 访问 成 本 为 1 元 ， 是 广告 整体 的 3 倍 ， 流 量 成 本 过 高 ; 其 ROI 仅 为 0.3， 关 键 漏 失 节 点 为 用 户 查 看 商品 后 加 入 购物 车 的 意向 低 ， 另 外 ， 其 客 单价 仅 为 26 元 ， 也 存在 试探 性 的 购买 趋势 。 


表 9-15 广告 新 增 媒体 效果 数据 


每 次 访问 


且 玉 扣 


ET 


供 解 折 对 于 此 类 转化 效果 差 的 数据 ， 只 需要 根据 漏斗 依次 从 着 陆 页 、 产 品 页 、 加 入 购物 车 页 、 结 算 页 、 提 交 订 单 页 开始 ， 进 行 漏斗 分 析 即 可 找到 短 板 。ROI 的 真实 计量 方法 应 该 是 利润 /费用 ， 但 在 
电 商 业务 体系 中 ， 利 润 通常 为 负 ， 因 此 采用 销售 额 / 费 用 的 计算 方式 。ROI 计 算 有 两 种 方法 : 方法 一 为 ROI= 人 均 回 报价 值 / 人 均 访问 成 本 (每 Visit 或 每 UV) ; 方法 二 为 ROI= 总 收入 /总 费用 。 这 两 种 方法 可 以 
综合 评估 单位 与 整体 投入 的 产 出 比 。 


(4) 营销 渠道 效果 排名 与 价值 趋向 


要 实现 不 同 渠 道 效果 的 横向 对 比 ， 并 突出 渠道 贡献 特征 ， 这 里 使 用 专家 打分 法 进行 权重 划分 并 最 终 计 算 综合 得 分 。 


第 一 步 : 确定 权重 。 专 家 打分 法 是 将 定性 经 验 转化 成 定量 数据 的 有 效 方法 。 以 广告 类 渠道 为 例 ， 权 重 打分 法 步骤 为 广告 类 渠道 对 于 三 类 指标 的 划分 是 流量 类 > 会 员 类 > 销售 类 ， 以 满分 10 分 为 总 分 值 ， 业 
务 负责 人 分 别 确 定 流量 类 、 会 员 类 、 销 售 类 指标 权重 ， 假 设 划 分 为 7、2、1， 那 么 流量 类 、 会 员 类 、 销 售 类 指标 的 权重 分 别 为 70%、20% 和 109%。 


第 二 步 : 确定 指标 。 指 标 选 取 的 原则 是 指标 间 尽 快 避免 高 度 相关 、 指 标 能 完整 反映 价值 量 和 价值 水 平 ， 同 时 指标 要 能 满足 业务 当前 的 操作 重点 。 比 如 分 别 选 择 访问 数 和 访问 成 本 作为 流量 类 指标 ;新 注 
会 员 数 和 注册 购买 率 作 为 会 员 类 指标 ; 订单 量 和 订单 转化 率 作 为 销售 类 指标 。 


第 三 步 : 数据 标准 化 。 为 了 减少 数据 量 级 之 间 差 异 造成 的 数据 失衡 ， 数 据 标准 化 是 重要 步骤 。 经 过 处 理 之 后 的 数据 ， 如 表 9-16 所 示 。 


表 9-16 渠道 标准 化 后 的 数据 


流量 类 
EE /% 


第 四 步 : 计算 得 分 。 在 第 一 步 中 我 们 分 别 计算 了 流量 类 、 销 售 类 和 会 员 类 权重 的 得 分 ， 但 并 没有 计算 细 分 指标 的 权重 ， 如 访问 数 和 访问 成 本 该 如 何 分 配 权 重 。 对 于 细 分 指标 的 权重 计算 ， 可 以 参考 专家 
打分 法 进行 打分 。 假 设 我 们 按照 1: 1 的 权重 进行 划分 ， 即 访问 数 和 访问 成 本 权重 相等 ， 那 么 每 个 渠道 的 最 终 综 合 得 分 计算 公式 为 : 


A 


绽 


综合 得 分 = 流量 类 权重 X (Z 访 问 数 -ZZ 访 问 成 本 ) + 销售 类 权重 X〈 乙 订单 量 +Z 转 化 率 ) + 会 员 类 权重 X 〈Z 新 增 用 户 数 +Z 注 册 购 买 率 ) 


ii 细心 的 读者 已 经 发 现 ， 公 式 中 的 访问 成 本 使 用 减 号 ， 为 什么 没有 跟 其 他 指标 一 样 使 用 加 号 呢 ? 原因 是 对 于 成 本 类 数据 以 及 跳出 率 、 退 出 率 等 数据 ， 即 使 经 过 标准 化 ， 指 标 内 数据 的 量 级 关系 仍 
然 不 会 改变 ， 即 访问 成 本 为 9 元 与 访问 成 本 为 2 元 的 两 个 数据 ， 标 准 化 之 后 仍然 是 Z9>Z2; 乙 数 据 越 低 则 越 符合 业务 预期 ， 因 此 这 里 使 用 减 号 来 反映 该 趋向 。 


以 BD 渠 道 流量 类 、 销 售 类 、 会 员 类 权重 4: 3: 3 为 例 ， 细 分 权重 按照 1: 1 计算 得 分 ( 细 分 权重 也 可 以 按照 专家 打分 法 划分 权重 ) 。 


BI=04x [19= (=03)|] :403 (3940.1) 03 [44312057)] =3.22 
B04 | 01 (-03)| 03% [0 ( 007) 03 Cg92923 ) 064 


经 过 计算 后 所 有 的 模块 都 有 得 分 ， 那 么 模块 之 间 可 以 通过 数值 进行 对 比 。 部 分 计算 结果 按照 总 得 分 排序 ， 如 表 9-17 所 示 。 
表 9-17 总 得 分 排名 数据 
流量 类 销售 类 
模块 站 四 4 ' 一 一 9 Lm | 了 
访问 数 | 访问 成 本 /元 转化 率 /% | 新 增 注册 购买 ; 


这 个 模型 能 反映 出 哪些 业务 流程 或 存在 什么 实际 价值 ? 


总 得 分 /分 


` 找到 各 个 营销 模块 和 渠道 自身 的 短 板 ， 以 确定 下 一 步 的 优化 方向 。 

. 各 模块 内 部 渠道 有 了 进行 对 比 的 依据 ， 在 费用 控制 、 媒 体 组 合 优化 时 提供 了 优化 依据 ， 同 时 经 过 长 期 数据 积累 可 以 发 现 渠道 间 价 值 排 位 的 变化 特征 。 
. 各 模块 间 具 有 相互 比较 的 基本 依据 ， 为 营销 决策 层 进行 渠道 组 合 和 优化 时 提供 了 初步 辅助 参考 数据 。 

(5) 整体 总 结 与 效果 建议 

总 结 建议 在 各 个 分 析 模 块 中 都 需要 有 针对 性 的 讲解 ， 该 部 分 提供 的 总 结 建议 通常 是 针对 整体 的 、 规 律 性 的 、 重 要 方向 和 趋势 总 结 。 以 下 是 示例 总 结 


. 寻找 各 媒体 最 优化 投放 节点 。 营 销 节奏 上 ， 流 量 计 划 与 实际 完成 情况 基本 吻合 ， 整 体 计 划 完 成 度 。 但 在 做 流量 计划 时 ， 需 要 考虑 道 的 最 优化 投放 控制 节点 ， 该 最 优化 节点 需要 考虑 流量 、 
访问 成 本 、 转 化 率 等 要 素 ， 各 个 渠道 的 控制 节点 需要 在 接 下 来 的 数据 工作 中 作为 重点 ， 尤 其 是 整体 流量 可 控 性 较 高 的 A1、S2、 某 导航 猜 你 喜欢 等 ， 通 过 费用 来 控制 的 媒体 以 及 通过 排 期 控制 的 媒体 如 A3、A5 


等 广告 渠道 。 


增加 对 线 下 广告 效果 的 评估 。 此 次 线 下 广告 投放 ， 效 果 无 法 过 线 上 数据 体现 出 来 ， 针 对 线 下 广告 投放 的 用 户 效 果 调 查 是 衡量 线 下 效果 的 重要 途径 ， 在 接 下 来 的 工作 中 需要 针对 这 部 分 内 容 做 单 


. 制定 适合 媒体 特性 的 评估 指标 。 在 公司 整体 营销 背景 和 促销 目的 下 ， 需 要 根据 不 同 媒体 特性 制定 个 性 化 指标 ， 如 互动 营销 媒体 需要 均衡 考虑 对 用 户 维护 、 用 户 履 盖 和 用 户 互动 的 效果 指标 ; EDM 需 要 
根据 不 同 的 邮件 目的 ， 如 针对 流失 用 户 的 EDM 需 要 增加 挽回 率 、 针 对 新 注册 但 未 购买 用 户 增加 购物 激活 率 等 指标 。 在 保证 大 型 营销 的 效果 下 ， 更 加 合理 考核 各 渠道 的 效果 。 


5. 沟 通 落 地 

通常 公司 级 的 大 型 营销 效果 分 析 对 象 非常 多 ， 基 本 可 以 分 为 以 下 三 类 。 

第 一 类 : 营销 决策 层 和 领导 层 。 对 于 领导 层 重 点 汇报 营销 计划 和 完成 预期 、 重 要 营销 成 果 尤 其 是 大 费用 投放 渠道 、 新 增 投放 渠道 等 。 
第 二 类 : 营销 执行 层 。 对 于 执行 层 重点 分 析 不 同 推广 渠道 的 特征 和 执行 效果 ， 存 在 哪些 问题 及 营销 机 会 


第 三 类 : 与 营销 相关 的 其 他 部 门 ， 如 运营 、 在 线 销售 、 产 品 体 验 等 。 对 于 这 类 对 象 重点 是 将 全 局 性 的 趋势 和 重要 事件 进行 通报 ， 以 便 其 了 解 这 些 事 件 对 于 自身 业务 操作 的 影响 。 


9.5 本章 小 结 


本 章 重 点 前 述 了 如 何 进行 营销 辅助 决策 支持 ， 重 要 知识 点 如 下 : 

` 网 站 营销 分 析 的 三 种 应 用 场景 及 分 析 方 法 ; 

` 常用 的 网 站 营销 分 析 维 度 ， 尤 其 是 对 于 目标 、 媒 体 、 竞 争端 的 把 握 。 

为 了 提高 本 书 的 实战 效果 ， 请 读者 继续 完成 以 下 几 个 工作 。 

“ 思考 : 为 什么 着 陆 页 跳出 时 无 法 评估 准确 的 页 面 停留 时 间 ? 

` 深入 : 继续 分 析 多 渠道 路 径 间 的 进一步 关联 访问 及 订单 归 因 分 析 。 

布局 : 针对 企业 的 实际 情况 ， 逐 步 建立 完善 的 、 履 盖 各 个 业务 场景 的 辅助 报告 矩阵 。 

` 应 用 : 写 一 篇 营 销 分 析 报告 ， 以 虚假 流量 、 订 单 归 因 、 效 果 聚 类 或 营销 效果 分 析 为 主题 ， 直 接 通过 报告 验证 本 书 的 分 析 结 论 和 方法 。 


营销 辅助 决策 是 当前 与 网 站 分 析 结 合 最 紧密 的 课题 ， 一 个 完善 的 营销 辅助 决策 体系 将 极 大 促进 企业 内 部 营销 洞察 和 优化 ;但 所 有 面向 业务 的 决策 支持 中 ， 数 据 的 作用 最 多 只 有 50%， 另 外 50% 是 业务 经 
验 。 因 此 希望 读者 在 保持 扎实 的 数据 素养 的 同时 ， 提 高 业务 素养 与 基本 常识 ， 两 条 腿 走 路 才能 更 长 远 。 


第 10 章 ”数据 驱动 下 的 数 子 膏 销 应 用 
正如 本 书 中 一 直 强 凋 的 ， 单 纯 的 报告 、 报 表 无 法 形成 驱动 作用 ， 数 据 驱 动 必须 是 自动 化 、 智 能 化 、 数 据 化 的 应 用 过 程 。 这 要 求 数据 不 再 作为 一 个 辅助 决策 主体 ， 而 是 作为 一 项 业务 主体 真正 融入 企业 运 
营 的 环节 当中 ， 形 成 数据 的 自我 认 知 、 自 我 实践 、 自 我 评估 和 自我 优化 . 


数字 营销 是 当前 数据 驱动 过 程 中 较为 成 熟 的 应 用 领域 ， 本 章 将 围绕 数据 驱动 下 的 数字 营销 应 用 ,介绍 数字 营销 的 概念 、 范 围 、 发 展 以 及 核心 的 个 性 化 媒体 投放 的 应 用 原理 、 价 值 、 技 术 框 架 和 实现 方式 
以 及 存在 的 问题 等 。 


10.1 ”数字 营销 的 概念 和 汽 转 
援引 MBA 智 库 的 定义 ， 所 谓 数 字 营 销 就 是 指 借助 于 互联 网 络 、 电 脑 通 信 技 术 和 数字 交互 式 媒 体 来 实现 营销 目标 的 一 种 营销 方式 。 数 字 营 销 将 尽 可 能 地 利用 先进 的 计算 机 网 络 技术 ， 以 最 有 效 、 最 省 钱 的 
方式 谋求 新 的 市 场 的 开拓 和 新 的 消费 者 的 挖 扎 。 此 定义 中 体现 了 数字 营销 的 几 个 特点 : 
* 跨 平台 属性 。 基 于 数字 媒体 的 网 络 、 通 信 、 移 动 终端 、 交 互 媒 体 等 平台 的 立体 窗 盖 。 
" 数字 化 手段 。 广 告 主 与 用 户 之 间 的 沟通 都 是 通过 数字 化 手段 进行 的 。 
有 效 评估 性 。 数 字 营 销 可 借助 于 技术 进行 成 本 与 产 出 的 最 优化 评估 。 


* 以 用 户 为 中 心 。 营 销 与 传播 的 核心 对 象 是 用 户 。 


10.2 数字 营销 友 展 的 三 个 阶段 


(1) 大 众 媒体 投放 时 代 
大 众 传播 是 通过 媒介 组 织 向 为 数 众多 、 成 分 复杂 的 受众 大 规模 地 传播 信息 的 过 程 。 大 众 传播 运用 一 系列 具有 特定 含义 的 传播 符号 ， 诸 如 语言 、 文 字 、 音 乐 、 音 响 、 图 片 、 影 像 等 向 受众 进行 信息 传播 。 
由 于 过 去 信息 化 普及 低 ， 广 告 传递 呈现 单 向 性 。 大 众 媒体 包括 电视 、 电 台 、 报 纸 等 传统 媒体 ， 还 包括 互联 网 初期 的 门户 等 网 络 媒体 ， 其 特点 是 受众 面 广 但 针对 性 弱 ， 营 销 传播 的 侧重 点 是 全 面 曝光 。 


(2) 分 众 媒体 投放 时 代 


随 着 科技 的 发 展 、 信 息 接触 点 爆发 式 增长 以 及 用 户 的 兴趣 和 忠诚 度 的 变化 ， 大 众 媒体 已 经 很 难 符合 营销 传播 的 主流 需求 。 此 时 ， 媒 体 投放 朝 着 “分 众 ” 或 “ 细 分 ”方向 发 展 ， 典 型 的 细 分 特征 如 下 : 
* 基于 地 域 的 细 分 。 即 使 是 传统 广告 媒体 也 在 发 生变 革 ， 大 众 媒体 可 以 基于 地 理 位 置 (国家 、 省 、 市 、 区 甚至 基于 住宅 楼 等 ) 进行 广告 投放 ， 通 过 地 域 区 隔 精准 定位 目标 用 户 。 


“ 基于 时 间 的 细 分 。 如 周一 至 周 五 ， 同 时 在 10~18 点 之 间 进 行 投放 。 

. 基于 媒体 类 型 。 如 地 铁 媒体 、 楼 宇 液晶 显示 器 、 机 场 海报 等 都 是 针对 不 同类 型 的 受众 进行 区 分 的 。 

. 基于 设备 的 细 分 。 通 过 访问 设备 如 PC、 手 机 终端 及 其 他 入 网 设备 进行 区 分 。 

基于 行为 的 细 分 。 基 于 搜索 词 、 网 络 、 购 买 商 品 的 网 站 进行 用 户 区 分 。 

除 此 之 外 还 有 很 多 种 用 户 细 分 方法 ， 这 些 细 分 媒体 的 本 质 是 将 用 户 划分 为 群 组 ， 然 后 基于 群 组 规则 进行 定向 营销 。 

(3) 个 性 化 媒体 投放 时 代 

个 性 化 媒体 投放 时 代 ， 媒 体 投放 内 容 是 基于 用 户 兴 趣 、 行 为 、 时 间 等 综合 因素 提炼 的 个 性 化 内 容 。 换 名 话说， 媒体 内 容 只 为 你 定制 并 且 专 属于 你 。 


个 性 化 媒体 投放 是 通过 对 用 户 数据 的 采集 、 挖 握 和 分 析 ， 猜 测 用 户 的 需求 并 有 针对 性 的 提供 传播 内 容 。 个 性 化 媒体 投放 不 仅 侧 重 于 站 外 内 容 展现 ， 也 包括 用 户 点 击 站 外 广告 到 达 着 陆 页 之 后 的 第 一 接触 
点 信息 的 个 性 化 推送 。 


现在 ,数字 营销 已 经 逐渐 进入 个 性 化 媒体 投放 时 代 。 


10.3 个 性 化 媒体 投放 的 价值 


个 性 化 媒体 投放 与 传统 大 众 媒体 、 分 众 媒体 投放 相 比 ， 其 价值 体现 在 以 下 三 方面 。 


第 一 : 更 好 的 用 户 体验 。 传 统 广告 的 单 向 传播 模式 在 个 性 化 媒体 时 代 发 生 了 变化 ， 用 户 的 每 一 个 “声音 ”都 被 记录 和 分 析 ; 同时 ， 媒 体 已 经 开始 “猜测 ”用 户 需 求 ， 媒 体 的 角色 开始 从 主观 推送 需求 向 
客观 猜测 并 尽量 满足 需求 转变 ， 整 个 过 程 的 用 户 认 知 度 、 体 验 度 和 忠诚 度 提高 。 


二 : 营销 效率 的 提升 。 传 统 广告 的 购买 与 投放 执行 主要 依靠 广告 代理 或 企业 自身 ， 经 过 谈判 之 后 购买 固定 时 间 、 版 面 、 人 群 、 网 站 群 等 ， 由 于 整个 过 程 主要 靠 人 工 操作 ， 效 率 低 且 出 错 概率 大 ， 更 重 
要 的 是 要 耗费 大 量 的 人 力 、 财 力 、 物 力 和 时 间 成 本 。 个 性 化 媒体 投放 通过 自动 化 、 智 能 化 程序 实现 人 群 定位 、 素 材 管理 与 投放 、 效 果 评 估 与 自我 优化 等 关键 流程 ， 大 大 提高 了 营销 效率 。 


三 : 营销 效果 的 提升 。 个 性 化 媒体 投放 从 广告 曝光 、 点 击 、 到 达 这 三 个 关键 环节 都 是 针对 用 户 个 性 化 需求 而 提供 的 内 容 ， 高 度 相关 的 内 容 提高 了 广告 点 击 率 、 到 达 率 ， 直 接 从 广告 源头 提高 流量 ， 直 
接 降 低 CPM、 每 次 点 击 成 本 和 每 次 访问 成 本 的 同时 还 能 促进 广告 转化 率 的 提升 。 


i 个 性 化 媒体 投放 针对 用 户 投 放 个 性 化 内 容 ， 在 广告 整个 生命 周期 内 的 各 个 环节 效果 指标 都 会 有 所 提升 ， 包 括 更 好 的 点 击 率 和 点 击 次 数 、 更 好 的 二 跳 率 和 访问 深度 、 更 高 的 转化 率 与 转化 贡献 价 
值 等 。 


10.4 个 性 化 媒体 投放 的 技术 架构 


个 性 化 媒体 投放 的 技术 架构 主要 分 为 四 部 分 ， 由 下 到 上 依次 为 数据 层 、 算 法 层 、API 层 和 应 用 层 ， 如 图 10-1 所 示 。 
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控制 算法 


挖掘 算法 


用 户 属性 库 产品 知识 库 业务 规则 库 行业 规则 库 


图 10-1 个 性 化 媒体 投放 的 技术 架构 
10.4.1 数据 层 

数据 层 的 数据 分 为 两 部 分 : 一 是 原始 数据 ; 二 是 模型 数据 。 

1. 原 始 数据 

原始 数据 是 系统 采集 到 的 处 于 原始 状态 、 未 经 过 处 理 的 数据 ， 包 括 网 站 数据 、 营 销 数据 、CRM 数 据 、 采 集 数 据 、 效 果 数 据 及 其 他 数据 。 
` 网 站 数据 包含 两 部 分 : 一 部 分 是 网 站 内 容 和 项 目 数 据 ， 即 要 推荐 对 象 的 基本 数据 ， 如 结构 、 类 别 、 属 性 、 状 态 等 ; 另 一 部 分 是 用 户 日 志 数据 ， 包 含 网 站 端 用 户 的 属性 、 行 为 、 在 线 订 单 等 数据 。 
. 营销 数据 包括 站 内 营销 投放 数据 ， 包 括 广告 内 容 标 签 、 投 放 媒 介 、 投 放 标 的 、 竞 价 数 据 、 用 户 点 击 喜好 数据 等 。 
* CRM 数 据 包括 企业 通过 客户 管理 系统 存储 的 用 户 真实 人 口 属 性 、 订 单 销 售 、 生 命 周期 、 喜 好 特征 等 数据 及 标签 。 

* 采集 数据 包括 可 供应 用 的 站 外 采集 数据 ， 如 用 户 站 外 评论 、 购 买 、 分 享 等 数据 。 


` 效果 数据 包括 广告 推荐 系统 产生 效果 的 数据 ， 如 推荐 渠道 、 上 曝光、 点 击 、 购 买 等 。 


: 其 他 数据 包括 与 其 他 公司 的 交换 数据 、 购 买 数据 、 市 场 调查 数据 等 。 
2. 模 型 数据 
模型 数据 是 经 过 处 理 的 标准 化 、 整 合 后 的 数据 ， 通 常 包括 用 户 属性 库 、 产 品 /内 容 知 识 库 、 业 务 规则 库 、 行 业 规则 库 。 


用 户 属性 库 是 以 用 户 为 主键 的 标准 化 数据 ， 包 括 用 户 所 有 属性 、 行 为 、 状 态 等 原始 汇总 标签 。 图 10-2 所 示 为 一 段 用 户 属 性 库 的 数据 示例 ， 根 据 底层 数据 结构 和 上 层 的 应 用 区 别 ， 该 数据 可 能 采取 分 布 式 
存储 ， 也 可 能 做 集中 式 存 储 。 


襄 小 王 | 28| 6093| 手 机 | 学 果 4S |]Aza444 | 岂 浪 | | zol 833| 4211 
本 本 


35| 12043| 夏 普 ”| 夏普 8932 液 A34944 | 再 度 | 电视 | 2014/6/12| 3556| 23354 


图 10-2 ”用户 属性 库 示 例 


产品 /内 容 知 识 库 是 围绕 网 站 产品 或 内 容 的 标准 化 数据 ， 包 含 所 有 产品 或 内 容 的 属性 、 状 态 等 数据 。 图 10-3 所 示 为 一 段 手机 产品 知识 库 的 数据 示例 。 


FID | 和 |- 大 天 出 | 由 寺 | 业 名 ”| 利 式 ”网 实 方式 “| 上 条 时 间 “5G 视频 通话 近世 
961821| 芝 时 Phone 4S 8G| 手 机 通讯 | ”| 白色 。 | 联通 3G | 合约 机 ”| ”2012471| 不 支持 。 iOS7 | 29] 六 果 A5 


图 10-3 产品 /内 容 知 识 库 示 例 


业务 规则 库 指 根据 业务 规则 和 业务 经 验 生 成 的 数据 集 ， 包 括 业务 操作 规则 、 时 间 规 则 、 效 果 评 估 规 则 、 流 程 规则 等 ， 该 规则 既 包含 企业 内 部 运 曹 的 业务 规则 ， 又 包含 产品 /内 容 之 间 规 则 的 规律 性 知识 。 
图 10-4 所 示 为 一 段 业务 规则 库 的 数据 示例 ， 该 示例 前 述 了 两 个 商品 在 不 同时 间 段 需要 推送 的 权重 。 


图 10-4 业务 规则 库 示 例 


行业 规则 库 指 适用 于 整个 行业 的 个 性 化 投放 规则 集 ， 例 如 某 产 品 A 进入 豪 退 期 ， 需 要 积极 清仓 以 避免 产品 积压 及 后 期 运营 风险 等 。 


在 数据 集 范围 内 ， 除 了 对 数据 进行 抽取 、 转 化 和 加 载 


等 常规 清洗 操作 ， 模 型 数据 中 还 会 包括 通过 挖掘 模型 已 经 构建 好 的 结果 标签 ， 例 如 用 户 偏好 、 用 户 生命 周期 、 产 品 生命 周期 、 关 系 生命 周期 、 用 户 
相似 度 、 内 容 相似 度 、 内 容 关 联 度 、 商 品 偏好 、 价 格 敏感 度 等 ， 这 些 数 据 是 进 4 


了 下 一 步 个 性 化 投放 的 重要 数据 。 
在 数据 集 时 间 上 ， 按 照 数 据 的 时 间 有 效 性 可 分 为 实时 数据 、 临 时 数据 和 远 期 数据 ， 不 同 模型 会 根据 场景 和 规则 等 调用 不 同 的 数据 集 。 如 针对 搜索 推荐 调用 实时 数据 或 临时 数据 ， 其 结果 将 更 有 效 ; 针对 
用 户 生 命 周期 的 挖掘 需要 结合 用 户 远 期 数据 才能 完整 挖掘 其 价值 和 喜好 。 


10.4.2 算法 层 

算法 层 是 个 性 化 媒体 投放 的 核心 要 素 ， 挖 气 算 法 包括 协同 过 滤 、 关 联 规则 、 基 于 内 容 的 推荐 、 基 于 社会 网 络 的 推荐 算法 、 其 他 算法 、 组 合 推荐 算法 等 ; 控制 算法 包括 过 度 推荐 控制 、 补 足 推 荐 控制 、 冷 
启动 控制 和 过 滤 排 序 控制 等 。 

1. 挖 所 算法 

(1) 协同 过 波 

协同 过 滤 Collaborative Filtering，CF) 是 利用 兴趣 相同 、 拥 有 共同 经 验 的 群体 喜好 来 预测 用 户 喜好 的 方法 。 协 同 过 滤 通 常 分 为 基于 项 目的 协同 过 滤 (item-based CF) 和 基于 用 户 的 协同 过 渡 
(user-based CF) ， 核 心 是 根据 不 同 用 户 对 项 目的 评分 来 预测 项 目 之 间或 用 户 之 间 的 相似 性 ， 并 基于 这 种 相似 性 做 出 推荐 。 除 此 以 外 还 有 基于 模型 的 协同 过 滤 以 及 混合 协同 过 滤 机 制 。 

举例 : 图 10-5 所 示 为 基于 用 户 的 协同 过 滤 机 制 。 假 设 用 户 A 喜 欢 物 品 A、C; 用 户 B 喜 欢 物 品 B; 用 户 C 喜 欢 物品 A、C、D。 从 用 户 的 历史 喜好 信息 中 ， 我 们 可 以 发 现 用 户 A 和 用 户 C 的 口味 和 偏好 比较 类 
似 ， 因 此 可 将 物品 D 推 荐 给 用 户 A。 


协同 过 滤 推 荐 的 自动 化 和 个 性 化 程度 高 ， 并 且 能 处 理 复杂 的 内 容 和 推荐 对 象 ， 可 以 有 针对 性 的 推荐 用 户 尚未 发 握 的 新 兴趣 点 。 但 是 ， 协 同 过 滤 在 面 对 新 客户 时 由 于 无 法 与 其 他 用 户 特征 进行 比 对 ， 因 此 
无 法 产生 有 效 的 推荐 结果 ; 另外 ， 面 对 数据 稀疏 性 的 解决 方案 以 及 算法 可 扩展 性 较 差 的 问题 ， 协 同 过 滤 仍 然 存在 改进 空间 。 


用 户 C 


图 10-5 基于 用 户 的 协同 过 滤 机 制 


(2) 关联 规则 


关联 规则 (Association Rules) 本 书 已 经 不 止 一 次 提 到 过 ， 关 联 规则 可 以 广泛 应 用 于 用 户 的 浏览 、 搜 索 、 购 买 、 产 品 等 推荐 场景 。 例 如 ， 用 户 浏 览 了 A 广告 之 后 可 推荐 B 广 告 作为 精准 匹配 ， 搜 索 了 A 关 
键 字 之 后 有 针对 性 的 推荐 B 关 键 字 作为 下 一 步 优化 搜索 建议 ， 用 户 查看 了 A 产品 之 后 推荐 最 可 能 浏览 的 B 产 品 以 及 用 户 将 A 产品 加 入 购物 车 之 后 表 推 荐 B 产 品 一 起 购买 。 


关联 规则 技术 成 熟 目 推荐 结果 较为 直观 ， 可 以 发 现 用 户 的 长 尾 需 求 并 进行 推荐 ， 尤 其 在 销售 领域 应 用 广泛 。 但 如 果 产 品 、 内 容 或 推荐 项 目 存 在 同 义 性 将 无 法 产生 准确 结果 ， 另 外 数据 抽取 规则 复杂 且 耗 
时 ， 无 法 应 用 于 实时 个 性 化 推荐 场景 。 


(3) 基于 内 容 的 推荐 


基于 内 容 的 推荐 (Content-based Recommendations) 很 大 程度 上 是 在 进行 文本 、 图 像 等 内 容 的 挖掘 。 基 于 内 容 的 推荐 可 通过 分 析 内 容 提 炼 出 特征 ， 然 后 通过 用 户 对 特征 的 反馈 来 学 习 用 户 喜 好 特 
征 ， 最 后 将 具有 其 他 类 似 特征 的 内 容 推荐 给 用 户 。 


举例 : 图 10-6 展 示 了 基于 内 容 的 推荐 机 制 。 用 户 A 喜 欢 物 品 A， 用 户 B 喜 欢 物品 B， 用 户 C 喜 欢 物品 B。 基 于 内 容 分 析 得 出 物品 A 和 物品 C 具 有 高 度 相似 性 ， 因 此 可 以 将 物品 C 推 荐 给 用 户 A。 


基于 内 容 的 推荐 可 以 对 用 户 兴趣 很 好 地 进行 建 模 ， 并 通过 对 物品 属性 维度 的 增加 ， 获 得 更 好 的 推荐 精度 。 但 是 ， 当 物品 的 属性 有 限时 将 很 难得 到 更 多 数据 ， 而 当 物 品 属性 过 多 时 如 何 分 配属 性 间 的 权重 
并 更 快 得 到 推荐 结果 该 算法 仍然 存在 问题 。 另 外 ， 算 法 本 身 只 考虑 到 物品 相似 度 的 做 法 存在 一 定 的 片面 性 ; 对 新 用 户 “ 冷 启动 ”时 无 任何 喜好 特征 的 场景 仍然 没有 有 效 的 解决 办 法 。 
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图 10-6 ”基于 内 容 的 推荐 机 制 


(4) 基于 社会 网 络 的 推荐 算法 


基于 社会 网 络 的 推荐 算法 是 通过 收集 用 户 在 社交 网 络 上 的 属性 (人口 社会 属性 ) 、 标 签 (喜好 、 兴 趣 、 类 别 ) 、 地 理 位 置 、 行 为 (原创 、 活 动 参与 、 转 发 、 评 论 、 分 享 、 点 赞 、 收 藏 ，、 社 交 关 系 (图 
子 、 粉 丝 和 关注 、 跟 随 、 信 任 、 拉 黑 、 重 点 关注 ) 等 进行 挖 握 分析， 找到 用 户 兴趣 点 并 进行 个 性 化 推荐 。 今 日 头条 新 闻 推荐 、 新 浪 微 博 的 关注 推荐 都 是 基于 这 种 模型 进行 的 。 


这 种 推荐 方法 本 质 上 是 基于 用 户 的 推荐 ， 社 交 网 络 数据 具有 动态 性 强 、 时 间 推 移 规律 明显 、 算 法 过 于 复杂 及 耗 时 较 长 等 特征 ， 该 算法 应 用 的 局 限 性 较为 明显 。 
(5) 其 他 算法 


除了 以 上 常用 算法 外 ， 还 有 部 分 算法 不 属于 个 性 化 推荐 算法 ， 但 也 会 应 用 到 个 性 化 推荐 场景 中 ， 如 基于 用 户 类 别 的 推荐 、 物 品类 别 的 推荐 、 基 于 物品 排名 或 时 间 热度 等 推荐 ， 这 些 算 法 通常 会 作为 特殊 
情况 下 的 应 用 ， 如 冷 司 动 、 数 据 稀 朴 性 等 。 


(6) 组 合 推荐 算法 

通过 以 上 算法 分 析 可 以 看 出 ， 每 种 算法 都 有 独特 优势 和 不 足 ， 通 过 组 合 不 同 算法 可 以 避免 或 弥补 各 种 推荐 技术 的 弱点 ， 常 用 的 组 合 方法 包括 : 

. 加 权 处 理 。 采 用 多 种 推荐 技术 运算 并 根据 权重 加 权 得 出 总 评分 ， 并 以 此 得 出 推荐 结果 。 

` 变换 场景 。 不 同 的 场景 采用 不 同 的 推荐 算法 ， 如 针对 新 用 户 基 于 内 容 推 荐 ; 针对 老 用 户 使 用 协同 过 滤 推 荐 。 

` 混合 展示 。 在 得 出 推荐 结果 时 ， 分 别 取出 每 种 推荐 结果 的 前 几 个 项 目 组 合 到 一 起 向 用 户 展示 。 

. 和 迭代 计算 。 在 使 用 一 种 推荐 算法 得 出 结果 后 ， 再 采用 其 他 工法 在 此 技术 上 进行 二 次 或 多 次 运算 。 

2. 控 制 算 法 

在 个 性 化 推荐 过 程 中 ， 受 数据 、 内 容 、 用 户 及 推荐 平台 本 身 的 限制 ， 以 及 受 外 部 人 工 干预 规则 等 因素 的 影响 ， 通 常 需 要 以 下 节点 进行 算法 控制 。 

过 度 推荐 控制 。 很 多 时 候 用 户 的 行为 在 时 间 上 是 随机 产生 的 ， 基 于 随机 数据 进行 的 数据 挖掘 与 模型 拟 合 可 能 存在 过 度 推荐 的 情况 。 另 外 ， 基 于 稀 朴 数据 产生 的 推荐 结果 也 可 能 产生 过 度 推荐 。 

补足 推荐 控制 。 当 推荐 结果 由 于 某 些 原因 不 能 正常 输出 时 ， 需 要 补足 推荐 机 制 以 保证 推荐 结果 正常 输出 。 如 推荐 结果 中 的 项 目 由 于 下 架 、 过 期 、 无 库存 、 删 除 等 原因 不 再 可 用 时 ， 需 要 考虑 蔡 代 性 的 应 
用 方案 。 

冷 局 动 控制 。 当 出 现 用 户 、 内 容 或 系统 冷 启动 时 采用 特殊 的 推荐 规则 ， 如 输出 TOPN、 最 新 项 目 等 。 

过 滤 排序 控制 。 根 据 推 荐 规则 过 滤 掉 用 户 不 喜欢 的 内 容 、 按 照 TOPN 或 者 时 间 衰 减 的 模式 排序 ， 以 及 根据 其 他 规则 控制 并 输出 结果 集 等 都 属于 过 滤 排 序 控制 。 


其 他 规则 控制 。 效 果 评 估 规 则 ， 根 据 效果 进行 算法 优化 、A/B 优 化 和 结果 控制 ， 人 工 干 预 的 规则 ， 如 设置 某 些 类 型 之 间 的 固定 关联 、 设 置 固 定时 间 段 内 强制 推荐 项 目 、 固 定 场景 下 的 强制 规则 等 ;测试 
和 试验 规则 ， 通 过 建立 小 规模 的 用 户 群 体 测试 算法 结果 等 。 


3. 实 时 计算 、 临 时 计算 与 离线 计算 

在 推荐 应 用 中 ， 不 同 场 景 对 于 数据 要 求 的 实时 性 不 同 。 实 时 计算 、 临 时 计算 和 离线 计算 分 别 满足 不 同 场景 下 的 应 用 需求 并 可 以 结合 各 自 优 势 进 行 推荐 效果 修正 和 补 齐 。 
. 实时 计算 能 更 快 地 响应 最 近 的 事件 和 用 户 交 互 ， 更 适合 实时 性 推荐 场景 。 但 会 限制 使 用 算法 的 复杂 性 和 处 理 的 数据 量 ， 并 且 结 果 输 出 可 能 缺乏 深度 挖 气 。 

. 离线 计算 由 于 以 批量 方式 完成 ， 对 于 数据 数量 和 算法 复杂 度 限 制 更 少 。 但 是 ， 由 于 没有 及 时 加 入 最 新 的 数据 ， 所 以 很 容易 过 时 且 不 能 反映 当前 灵活 多 变 的 结果 。 

. 临时 计算 介 于 实时 计算 与 离线 计算 中 间 ， 既 可 以 执行 离线 计算 的 算法 又 可 以 适度 保持 实时 性 。 


值得 注意 的 是 ， 实 时 计算 、 离 线 计算 与 临时 计算 通常 不 是 非 此 即 彼 的 应 用 ， 即 使 在 以 流 数 据 处 理 为 主 的 实时 计算 和 应 用 场景 中 ， 通 党 也 会 结合 临时 计算 和 离线 结果 的 挖掘 结果 进行 组 合 和 最 优化 推荐 ， 


以 便 使 结果 更 准确 。 
10.4.3 API 层 


(1) 数据 采集 接口 


推荐 系统 在 网 站 端 采集 用 户 行为 的 接口 信息 ， 该 信息 直接 来 源 于 代码 部 署 的 网 站 平台 ， 包 括 匿名 用 户 ID、 渠 道 来 源 、 搜 索 关 键 字 、 浏 览 页 面 、 加 入 购物 车 商品 等 在 线 行为 数据 ， 另 外 也 包括 采集 其 他 外 
部 数据 的 聆 虫 程序 接口 。 


(2) 数据 传 入 接口 


推荐 系统 所 需 的 用 户 数据 、 商 品 数据 、 内 容 数据 等 信息 ， 这 些 信 息 通过 企业 内 部 CRM、 库 人 存 系统 、 销 售 系统 、 订 单 系统 等 平台 获得 ， 包 括 注册 用 户 ID、 订 单 ID、 产 品 I1D、 交 


息 ， 这 些 信 商品 、 交 易 时 间 、 交 易 数 
量 等 订单 信息 ; 用户 ID、 性 别 、 年 龄 、 收 入 、 注 册 时 间 、 最 近 一 次 登录 时 间 、 评 论 、 收 藏 等 用 户 信息 ， 商 品 1D、 库 存量 、 价 格 、 类 别 、 品 牌 等 商品 和 库存 信息 等 。 


尖 


(3) 参数 传 入 接口 

参数 传 入 接口 包括 推荐 方法 、 推 荐 商品 或 内 容 项 目 、 商 品 或 内 容 项 目 类 别 、 推 荐 时 间 、 推 荐 范围 等 需要 推荐 算法 处 理 的 数据 集 。 

(4) 数据 传 出 接口 

通过 数据 传 出 接口 ， 推 荐 结果 集 得 以 输出 并 展示 到 推荐 渠道 ， 如 在 网 站 中 输出 推荐 的 商品 1D 或 内 容 ID 列 表 ， 在 站 外 推荐 广告 1D 列 表 等 。 
(5) 实时 过 滤 排 序 


结合 实时 过 滤 条 件 进 行 输出 结果 过 滤 ， 如 新 增 业 务 推荐 规则 等 。 
10.4.4 ”应 用 层 


个 性 化 推荐 针对 营销 端的 应 用 包括 智能 广告 、 个 性 化 EDM 和 个 性 化 广告 着 陆 页 。 
1. 智 能 广告 


智能 广告 区 别 于 传统 广告 之 处 在 于 智能 广告 基于 用 户 的 个 体 行为 进行 针对 性 的 广告 投放 ， 传 统 广 告 通常 基于 网 站 类 型 ， 用 户 标签 、 属 性 和 群 组 ， 时 间 、 地 域 等 粗 维度 进行 分 组 投放 ， 无 法 达到 个 性 化 广 
告 投 放 结 果 。 智 能 广告 可 分 为 基于 用 户 行为 的 Retargeting 广 告 和 基于 用 户 行为 的 DSP 和 RTB 广 告 。 


(1) Retargeting 广 告 

Retargeting 广 告 (也 称 为 重 定向 广告 或 再 营销 广告 ) 是 精准 广告 的 一 种 ， 其 原理 是 对 访问 网 站 的 用 户 进行 特殊 标记 ， 当 用 户 在 其 他 网 站 访问 时 有 针对 性 的 投放 广告 。 

举例 ， 用 户 在 网 站 A 将 商品 加 入 购物 车 但 未 完成 购买 ， 通 过 标记 将 该 用 户 进行 定位 ; 当 用 户 访问 其 他 网 站 B、C 时 ， 针 对 该 用 户 投放 其 放 入 购物 车 中 的 商品 以 便 其 能 够 完成 购买 。 
(2) 增强 的 DSP 和 RTB 广 告 

基于 用 户 行 为 的 DSP 和 RTB 广 告 指 在 原 有 的 DSP 和 RTB 框 架 中 加 入 用 户 个 性 化 推荐 的 部 分 ， 使 得 广告 推荐 更 加 精准 。 


当前 主要 的 广告 平台 包括 谷歌 DoubleClick AdExchange、 淘 宝 TANX、 腾 讯 和 新 浪 的 私有 Ad Exchange 以 及 百度 RTB 平 台 。 通 过 与 以 上 平台 对 接 ， 可 实现 广告 根据 访客 行为 偏好 、 广 告 维度 和 属性 、 当 
前 页 面 与 广告 相关 性 的 个 性 化 投放 。 


2. 个 性 化 EDM 


传统 的 EDM 广 告 针 对 全 部 或 一 组 用 户 列表 发 送 ， 由 于 缺乏 针对 性 、 信 息 过 时 等 问题 导致 EDM 效果 难以 提升 。 个 性 化 EDM 可 以 针对 用 户 站 内 的 访问 行为 ， 通 过 EDM 载 体 进行 有 针对 性 的 广告 和 内 容 投 
放 。 其 最 主要 的 特征 如 下 : 


个 性 化 EDM 不 是 称谓 个 性 化 及 用 户 群 组 细 分 ， 而 是 用 户 看 到 的 所 有 内 容 都 是 个 性 化 ， 即 “ 千 人 千 面 ”; 
“ 个 性 化 EDM 可 以 解决 在 信息 发 送 、 邮 件 打 开 、 内 容 点 击 三 者 之 间 由 于 时 间 间 隔 造 成 的 信息 不 一 致 问题 ， 使 得 用 户 在 不 同时 间 看 到 的 信息 都 处 于 最 新 、 实 时 的 状态 。 


人 ;说 个 性 化 EDM 与 传统 广告 的 重要 差异 点 在 于 其 时 间 间 隔 特 征 突出 ， 如 个 性 化 EDM 在 5 月 3 日 发 送 并 达到 ， 但 用 户 可 能 在 5 月 19 日 才 点 击 查看 。 由 于 存在 较 大 的 时 间 间 隔 ， 用 户 喜 好 、 商 品 或 内 容 状 
态 可 能 已 经 发 生 改 变 ， 这 要 求 推荐 信息 必须 根据 用 户 点 击 的 实时 状态 进行 动态 更 新 。 


3. 个 性 化 广告 着 陆 页 
个 性 化 广告 着 陆 页 指 着 陆 页 内 容 根据 用 户 站 外 、 历 史 站 内 行为 (如 果 有 ) 进行 动态 推荐 ， 以 实现 不 同 用 户 登录 网 站 后 看 到 个 性 化 、 自 己 偏好 的 内 容 。 


举例 : 一 个 新 用 户 在 百度 搜索 了 “匡威 ”并 点 击 该 天 键 字 广告 进入 网 站 ， 企 业 根据 用 户 站 外 搜索 词 信息 了 解 到 用 户 对 “匡威 ” 感 兴趣 。 因 此 ， 当 用 户 到 达 着 陆 页 时 ， 根 据 挖 掘 结果 展示 了 以 “匡威 ”为 
主 的 内 容 和 商品 信息 。 


10.5 ”个 性 化 媒体 投放 的 实现 


10.5.1 个 性 化 媒体 投放 的 实现 方式 


个 性 化 媒体 投放 要 求 接 入 国内 主要 的 媒体 投放 平台 ， 如 谷歌 DoubleClick Ad Exchange、 淘 宝 TANX、 腾 讯 和 新 浪 的 私有 Ad Exchange 以 及 百度 RTB 平 台 ， 国 内 已 经 具备 一 批 有 一 定 经 验 的 服务 提供 
商 ， 企 业 可 直接 通过 这 些 服务 商 进 行 个 性 化 广告 投放 。 


全 证 示 考虑 到 技术 要 求 、 行 业经 验 、 企 业 需 求 、 资 源 利用 率 等 方面 ， 国 内 的 广告 主 很 少 自 建 个 性 化 媒体 投放 平台 或 系统 ， 通 过 第 三 方 平台 进行 投放 是 主要 途径 。 换 名 话说 ， 如 果 企 业 要 投放 DSP， 不 
一 定 都 需要 自己 建立 一 套 DSP 系 统 。 


10.5.2 ”如 何 选 择优 秀 的 服务 提供 商 


在 选择 个 性 化 媒体 服务 提供 商 时 ， 除 了 企业 自身 需求 、 投 入 和 产 出 规划 以 外 ， 还 需要 综合 考虑 服务 商 的 以 下 几 方 面 的 内 容 。 
(1) 底层 数据 完整 性 
数据 是 个 性 化 媒体 投放 的 基础 ， 没 有 数据 或 数据 不 完整 会 导致 数据 稀疏 性 、 冷 启动 等 问题 ， 直 接 影 响 投放 效果 。 


对 于 服务 提供 商 而 言 ， 接 入 更 多 的 站 外 广告 媒体 平台 、 更 多 的 站 内 个 性 化 追踪 网 站 是 其 数据 挖掘 结果 可 靠 性 的 必要 保证 。 通 常 使 用 Cookie 总 量 (所 有 历史 时 间 Cookie 量 ) 、 有 效 Cookie 数 量 (最 近 一 
周 、 最 近 一 月 、 最 近 半 年 Cookie 量 ) 、 接 入 广告 平台 数量 (上 文中 提 到 的 主要 广告 平台 ) 、 接 入 更 多 外 部 网 站 的 站 内 个 性 化 推荐 或 跟踪 的 数量 等 进行 评价 。 


@ia 示 站 内 个 性 化 推荐 会 在 后 面 的 章节 讲 到 ， 接 入 更 多 的 外 部 网 站 数据 的 途径 主要 通过 提供 站 内 个 性 化 服务 。 举 例 ， 用 户 在 A 网 站 浏览 了 产品 A 并 加 入 购物 车 ， 然 后 用 户 又 在 B 网 站 同样 看 到 该 商品 并 
由 于 其 价格 更 低 而 直接 购买 。 如 果 服 务 提供 商 同 时 接 入 这 两 个 网 站 便 能 通过 Cookie 传 递 了 解 到 该 用 户 已 经 购买 了 产品 A， 在 站 外 广告 投放 时 不 会 再 针对 该 用 户 持续 性 投放 产品 A。 


(2) 技术 能 力 完善 性 


个 性 化 媒体 投放 以 及 站 内 推荐 应 用 的 核心 是 技术 实力 ， 需 要 考虑 的 关键 技术 包括 推荐 系统 整体 架构 的 稳定 性 与 可 扩展 性 、 数 据 分 布 式 存储 与 数据 质量 把 控 、 数 据 分 布 式 计算 与 流 数据 实时 处 理 、 用 户 行 
为 建 模 、 用 户 需求 识别 与 场景 识别 、 推 荐 效果 评估 优化 与 阔 值 控制 等 。 


(3) 应 用 范围 广阔 性 

当前 个 性 化 推荐 被 各 大 电 商 、 媒 体 等 企业 广泛 应 用 ， 但 应 用 领域 集中 于 站 内 个 性 化 内 容 、 产 品 、 资 讯 、 活 动 、 广 告 、 消 息 推送 、 人 脉 关 注 等 ， 应 用 范围 局 限 性 大 。 

实际 上 ， 个 性 化 推荐 还 可 以 被 应 用 到 站 外 ， 如 本 章 之 前 提 到 的 站 外 个 性 化 EDM、 个 性 化 短信 、 智 能 广告 投放 等 领域 ， 并 且 该 领域 可 以 直接 降低 站 外 营销 成 本 并 提高 营销 效果 。 
(4) 维护 和 二 次 开发 的 灵活 性 


个 性 化 媒体 投放 或 个 性 化 推荐 往往 与 公司 大 数据 战略 结合 紧密 ， 其 系统 架构 、 算 法 、 模 型 、 场 景 等 都 需要 良好 的 扩展 性 和 灵活 性 以 便 实 现 推荐 系统 与 大 数据 系统 的 对 接 ; 尤其 涉及 二 次 开发 过 程 中 的 关 
键 组 件 、 接 口 、 算 法 的 封装 需要 能 进行 解释 并 可 进行 二 次 编译 。 源 代码 级 别 的 合作 对 企业 大 数据 开发 工作 无 疑 具 有 更 大 的 价值 。 


10.6 个 性 化 媒体 投放 的 问题 


尽管 个 性 化 媒体 投放 具有 很 高 的 应 用 价值 和 实际 意义 ， 但 其 仍然 面临 着 许多 问题 。 
1. 媒 体 认 知 问题 


从 大 众 传播 开始 媒体 就 一 直 处 于 强势 地 位 ， 广 告 、 消 息 等 都 是 直接 通过 媒体 向 用 户 单 向 传播 ; 媒体 对 于 自身 定位 、 服 务 价值 、 服 务 方式 等 定位 仍然 停留 在 强势 媒体 阶段 ， 大 多 数 媒 体 尤 其 是 强势 媒体 还 
没有 “客户 服务 ”的 概念 ， 个 性 化 媒体 广告 投放 无 从 谈 起 。 这 直接 导致 了 接 入 个 性 化 媒体 平台 的 媒体 数量 ， 尤 其 是 优质 媒体 数量 的 不 足 。 


2. 优 势 资源 问题 


虽然 现在 可 供 选 择 的 媒体 平台 众多 ， 但 真正 的 高 价值 流量 仍然 集中 于 少数 媒体 ， 这 些 媒体 往往 通过 CPD ( 包 段 购买 ， 如 包 天 、 包 月 ) 、CPM (每 干 次 付费 ) 等 品牌 传播 类 形式 售卖 优势 资源 ， 如 新 浪 门 
户 的 首页 焦点 图 、 视 频 媒体 TIPS 弹 窗 等 、 导 航 文 字 链 都 属于 此 类 售卖 方式 ， 而 能 够 实现 个 性 化 媒体 投放 的 资源 往往 是 优势 资源 之 外 的 “剩余 资源 ”或 低 价 值 资源 位 ， 因 此 造成 个 性 化 媒体 投放 难以 大 规模 应 
用 到 核心 媒体 资源 或 核心 媒介 中 。 覆 盖 面 的 不 足 直 接 导致 了 曝光 的 补足 ， 个 性 化 媒体 从 入 口 开始 面临 紧缩 考验 。 


3. 技 术 实 现 问 题 
个 性 化 媒体 投放 本 身 面 临 着 数据 、 技 术 、 规 则 等 现实 技术 性 问题 ， 具 体 包括 以 下 内 容 。 
(1) 数据 稀疏 性 问题 与 数据 增 量 计算 问题 


随 着 推荐 系统 覆盖 的 数据 量 日 益 增加 ， 用 户 、 物 品 之 间 有 具备 明显 关系 的 比例 或 重 革 性 越 来 越 小 。 例 如 Netflix 的 数据 稀 琉 度 是 1.2%、Delicious 是 0.046%。 另 外 ， 当 数据 不 断 增 加 时 ， 数 据 间 的 关系 特征 
越发 不 明显 ， 并 且 要 在 保持 原 有 数据 特征 的 基础 上 将 最 新 数据 特征 加 入 原始 数据 特征 中 ， 数 据 对 应 的 复杂 特征 与 数据 处 理 所 需要 的 时 间 冲 突 越发 明显 。 


(2) 用 户 需求 的 识别 与 挖掘 


个 性 化 推荐 的 基础 是 用 户 数据 ， 由 于 用 户 偶然 性 产生 的 数据 是 否 真 的 能 反映 其 需求 吗 ? 另 外 ， 如 何 处 理 用 户 个 体 需 求 与 群体 共性 需求 的 关系 ， 以 及 用 户 现实 需求 与 未 来 需求 的 关系 ”这 些 都 不 只 是 数据 
本 身 能 解决 的 问题 ， 需 要 跨 学 科 、 跨 领域 、 跨 行业 的 实践 学 习 和 专家 知识 。 


(3) 冷 启动 问题 


当 新 用 户 、 新 项 目 或 新 系统 上 线 时 会 面临 冷 启动 问题 。 冷 启动 即 由 于 新 数据 的 出 现 导致 缺乏 足够 的 数据 进行 数据 挖掘 和 个 性 化 推荐 ， 包 括 用 户 冷 启动 、 项 目 冷 启动 和 系统 冷 启动 。 现 在 的 解决 方法 包 
括 : 


* 提供 非 个 性 化 推荐 结果 ， 如 热门 排行 榜 、 最 新 排行 ; 
“ 利用 用 户 或 项 目的 属性 、 类 别 、 行 为 信息 进行 基于 群 组 的 内 容 推荐 ; 
* 利用 社交 网 络 的 好 友信 息 推 荐 其 好 友 喜 欢 的 项 目 ; 
" 要 求 用 户 对 一 些 项 目 进行 反馈 以 便 推 荐 相似 的 其 他 项 目 ， 如 强制 选择 标签 ; 
` 使 用 基于 内 容 的 推荐 算法 〈 用 户 冷 启动 时 ) 。 
但 上 述 第 一 种 方案 不 属于 个 性 化 推荐 的 解决 方案 ， 除 了 第 一 种 以 外 都 属于 具备 一 定 特征 的 数据 ， 没 有 数据 仍然 无 法 解决 冷 启动 的 问题 。 
(4) 推荐 系统 无 法 识别 作 浆 特征 


个 性 化 媒体 投放 系统 属于 广告 的 一 种 形式 ， 传 统 广告 中 的 作 浆 行为 同样 存在 于 个 性 化 媒体 的 投放 中 。 在 个 性 化 媒体 投放 阶段 ， 一 些 人 出 于 特殊 目的 可 能 对 某 些 广告 、 素 材 等 进行 恶意 攻击 ， 以 达到 将 这 
些 内 容 特 意 展示 给 其 他 客户 的 目的 ， 比 如 具有 大 量 负面 评论 的 帖子 、 价 格 高 于 竞争 对 手 的 商品 、 过 期 的 促销 活动 等 。 个 性 化 推荐 由 于 需要 兼顾 用 户 数据 的 差异 性 与 群体 的 相似 性 ， 因 此 无 法 准确 判断 是 否 为 


作 交 行为 ， 更 缺乏 系统 性 的 作 次 识别 方法 。 
(5) 推荐 系统 的 效果 评估 问题 


推荐 系统 对 于 站 外 广告 投放 可 以 通过 广告 上 曝光、 广告 点 击 和 CTR 评 估 站 外 指标 ， 然 后 结合 站 内 访问 、 订 单 、 注 册 等 评估 站 内 转化 指标 。 但 当 推 荐 系统 应 用 到 站 内 个 性 化 投放 时 ， 很 难 评估 到 底 有 多 大 价 
值 是 真正 由 推荐 系统 带 来 的 。 换 句 话说 ， 如 果 没 有 推荐 系统 ， 站 内 销售 额 会 减少 多 少 ? 


10.7 本 章 小 结 


本 章 曾 述 了 数据 驱动 下 的 数字 营销 应 用 ， 其 核心 是 站 外 个 性 化 媒体 投放 。 本 章 需要 读者 重点 掌握 的 知识 点 如 下 : 

` 个 性 化 媒体 投放 的 架构 ， 包 括 数据 层 、 算 法 层 、API 层 和 应 用 层 。 

` 如 何 选择 优秀 的 服务 提供 商 ， 从 底层 数据 完整 性 、 技 术 能 力 完 善 性 、 应 用 范围 广阔 性 、 维 护 和 二 次 开发 的 灵活 性 四 个 维度 进行 了 剖析 。 

. 全 面 、 正 确 地 认识 个 性 化 媒体 投放 的 价值 以 及 存在 的 问题 。 

个 性 化 媒体 投放 只 是 个 性 化 推荐 的 站 外 应 用 ， 本 章 在 介绍 其 知识 点 时 也 顺便 介绍 了 一 部 分 站 内 个 性 化 推荐 的 相关 知识 ， 更 多 关于 站 内 个 性 化 推荐 的 应 用 将 在 之 后 的 章节 介绍 。 


个 性 化 媒体 投放 或 个 性 化 推荐 的 应 用 基础 是 数据 ， 数 据 在 这 个 过 程 中 的 角色 侧重 于 基础 数据 提供 、 效 果 评 估 与 模型 立 值 控制 、 数 据 输入 和 输出 对 接 ， 可 以 说 ,没有 数据 个 性 化 媒体 投放 或 个 性 化 推荐 是 
无 法 实现 的 。 


为 了 增加 读者 对 站 外 个 性 化 广告 的 了 解 ， 建 议 读 者 阅读 以 下 提供 的 更 多 知识 : 
* 查看 Criteo、Vizury (世界 级 重 定向 广告 服务 商 ) 了 解 更 多 关于 重 定向 (再 营销 ) 的 知识 。 


通过 阅读 Burke 等 人 2011 年 的 研究 报告 “Robust Collaborative Recommendation ”来 了 解 更 多 个 性 化 推荐 中 的 作 关 知识 。 


第 11 草 ”网 站 数据 的 运营 辅助 应 用 


网 站 数据 运营 辅助 应 用 的 对 象 是 以 网 站 为 业务 运营 载体 的 部 门 ， 包 含 网 站 运营 、 活 动 运营 、 用 户 体验 、 产 品 设 计 、 在 线 销售 等 部 门 。 网 站 数据 运营 辅助 应 用 是 网 站 数据 价值 的 重要 体现 ， 它 与 营销 辅助 
支持 共同 组 成 网 站 数据 辅助 支持 体系 。 


本 章 将 围绕 网 站 数据 的 运营 辅助 决策 与 应 用 展开 ， 包 括 网 站 运营 分 析 辅 助 决策 报告 矩阵 、 三 类 常见 的 网 站 运营 分 析 场 景 、 常 用 的 网 站 运营 分 析 维 度 和 网 站 运营 辅助 决策 四 大 案例 。 由 于 在 第 9 章 中 已 经 介 
绍 过 部 分 相关 知识 ， 本 章 对 于 相同 的 知识 点 将 一 笔 带 过 ， 而 将 重点 放 在 差异 点 与 关注 点 上 。 


11.1 网 站 运营 分 析 辅 助 决策 报告 矩阵 


网 站 运营 分 析 辅 助 决策 报告 矩阵 与 营销 辅助 决策 报告 矩阵 的 应 用 范围 相同 ， 包 括 临 时 分 析 、 实 时 分 析 、 日 常 报表 、 专 题 分 析 和 项 目 分 析 ， 以 下 是 不 同 报告 的 核心 关注 点 。 
" 由 于 网 站 运营 业务 的 涉及 面 广 ， 临 时 分 析 更 加 复杂 多 变 且 无 规律 性 。 

.实时 分 析 更 侧重 于 站 内 转化 效果 监测 与 异常 检测 ， 如 大 型 促销 活动 或 重要 活动 的 销售 实时 汇报 以 及 针对 作 浆 的 反 侦察 行为 。 

. 日 常 报表 侧重 于 运营 标杆 管理 与 标准 化 流程 的 参与 ， 通 过 数据 确定 运营 管理 规范 。 

“ 专题 分 析 除 了 专注 于 纵向 价值 挖 据 ， 还 需要 横向 拓展 不 同 运营 环节 、 资 源 之 间 的 相互 关系 ， 因 果 联 系 和 相关 影响 是 其 重要 特点 。 


“项目 分 析 需 要 将 公司 利益 与 部 门 利益 结合 ， 并 将 全 局 性 业务 流程 的 管理 规范 、KPI 制 定 、 战 略 规则 参与 纳入 其 中 。 


11.2 ”三 类 常见 的 网 站 运营 分 析 场 景 
除了 营销 辅助 决策 应 用 中 的 预测 与 规划 、 实 时 监测 与 反馈 和 总 结 与 分 析 可 被 应 用 到 运营 分 析 之 外 ， 点 、 线 、 面 的 场景 应 用 是 网 站 运营 分 析 的 显著 特点 。 


11.2.1 点 : 面向 单 体 坑 位 的 辅助 分 析 


1. 单 体 二 位 的 分 类 

(1) 广告 位 

站 内 广告 位 即 以 广告 的 形式 进行 售卖 或 运营 的 位 置 ， 按 照 面 向 对 象 的 不 同 ， 通 常 有 以 下 两 种 形式 : 

“ 一 是 平台 服务 商 针 对 平台 商家 的 广告 位 售卖 ， 以 资源 换 广 告 或 现金 售卖 广告 的 形式 牟利 ; 

` 二 是 自 有 服务 商 内 部 针对 不 同 销售 部 门 或 产品 部 门 进行 的 虚拟 广告 售卖 ， 目 的 是 刺激 内 部 竞争 优化 并 促使 公司 利益 最 大 化 。 
(2) 商品 位 

商品 位 是 电子 商务 网 站 在 线 运 营 的 核心 之 一 ， 根 据 不 同 的 促销 形态 可 分 为 : 


` 正常 商品 位 。 所 有 非 促 销 和 活动 之 外 的 商品 位 置 ， 包 括 首 页 、 类 目 页 、 列 表 页 、 搜 索 页 、 产 品 页 等 页 面 的 商品 位 都 属于 正常 商品 位 范畴 。 


. 活动 商品 位 。 活 动 商品 位 指 参加 大 型 促销 活动 的 商品 位 置 ， 常 见于 活动 主页 面 ( 主 会 场 ) 、 子 页 面 (分 会 场 ) 、 特 殊 促销 页 面 等 。 


. 抢购 商品 位 。 参 加 抢购 促销 形式 的 商品 位 。 


“ 团购 商品 位 。 参 加 团购 促销 形式 的 商品 位 。 


党 
咕 
袁 
如 
a 


oo 没有 实体 库存 ， 以 预 售 形 式 促销 的 商品 位 。 


次 拍卖 或 竞拍 的 商品 位 。 


A 
Ey 
准 
by 
EE 
由 

伴 
ny 
外 

次 


之 所 以 要 区 分 不 同情 况 下 的 商品 位 ， 是 因此 商品 在 不 同 促销 状态 下 的 运营 手法 不 同 ， 细 分 便于 针对 不 同 运营 手法 的 商品 位 做 个 案 分析 和 典型 特征 分 析 。 

(3) 其 他 单 体 坑 位 

除了 广告 位 和 商品 位 ， 企 业内 的 单 体 坑 位 还 可 能 包括 搜索 资源 、 文 字 链 资源 等 。 基 本 上 所 有 页 面 内 的 可 见 元 素 ， 在 条 件 允 许 的 情况 下 都 可 以 作为 运营 资源 位 。 
2. 单 体 坑 位 的 分 析 内 容 

站 内 单 体 坑 位 的 分 析 内 容 主 要 包括 以 下 几 个 方面 。 

(1) 曝光 能 力 

在 某 些 情况 下 ， 广 告 只 是 为 了 做 品牌 或 活动 宣传 ， 此 时 广告 曝光 是 主要 诉求 。 广 告 曝光 能 力 是 衡量 广告 所 在 页 面 对 用 户 展现 能 力 的 核心 。 

(2) 流量 引入 能 

类 似 于 站 外 广告 售卖 ， 流 量 引入 是 广告 最 主要 的 功能 之 一 。 流 量 越 高 代表 该 位 置 产生 的 价值 越 大 ， 因 此 流量 引入 能 力 是 效果 型 广告 最 核心 的 评估 内 容 。 

(3) 转化 贡献 价值 


单 体 坑 位 的 转化 贡献 价值 是 辅助 性 指标 。 当 用 户 点 击 广告 进入 目标 页 面 后 ， 由 于 受 站 外 推广 渠道 属性 、 用 户 特征 和 喜好 ， 以 及 站 内 用 户 体 验 、 流 程 设计 等 因素 的 综合 影响 ， 用 户 转 化 效果 难以 保证 ， 因 
此 单 体 坑 位 的 订单 转化 和 贡献 作用 通常 作为 流量 引入 能 力 的 辅助 参考 指标 。 


3. 单 体 坑 位 的 分 析 方 法 
(1) 曝光 能 力 
传统 的 使 用 指标 是 曝光 量 ， 统 计 原 理 是 广告 所 在 的 页 面 广 告 代码 加 载 一 次 就 计 为 一 次 上 曝光。 但 是 ， 这 种 评估 方法 无 法 确认 广告 是 否 真正 对 用 户 曝光 ， 即 可 能 出 现 广告 无 法 被 用 户 看 到 的 情况 。 


举例 : 某 资源 位 位 于 页 面 底部 ， 虽 然 该 页 面 展示 了 广告 ， 但 由 于 用 户 未 能 到 达 页 面 底部 而 无 法 看 到 广告 ， 此 时 的 广告 曝光 数据 的 参考 意义 很 小 。 针 对 这 种 情况 ， 我 们 可 以 使 用 更 为 精确 的 方法 来 判断 用 
户 是 否 真 的 能 够 看 到 或 已 经 看 到 广告 。 


如 


: 使 用 页 面 浏览 百分比 。 资 源 位 位 于 页 面 某 个 位 置 可 以 用 页 面 百 分 比 来 表示 ， 只 有 用 户 超过 这 个 百分比 之 后 才 有 可 能 看 到 这 个 广告 。 比 如 某 资 源 位 位 于 页 面 中 部 50% 的 位 置 ， 只 有 用 户 浏 览 页 面 长 度 超 
过 50% 才 有 可 能 看 到 广告 ， 此 时 我 们 可 以 针对 浏览 超过 50% 的 情况 制定 一 个 区 别 于 “原始 浏览 量 ” 的 “有 效 浏览 量 ” 指 标 进行 更 科学 的 评估 。 


. 使 用 页 面 鼠 标 触发 事件 。 某 些 情况 下 ， 即 使 用 户 到 达 资 源 位 所 在 的 页 面 也 不 一 定 看 广告 ， 此 时 我 们 可 以 使 用 Dnmouse 事 件 记录 资源 位 的 触发 次 数 。 例 如 ， 当 用 户 把 鼠标 放 到 资源 位 上 时 触发 记录 条 
件 ， 该 数据 是 用 户 真正 将 鼠标 放 到 资源 位 上 的 次 数 ， 代 表 了 更 加 真实 的 曝光 数据 ， 可 以 将 该 数据 标记 为 “ 悬 停 浏览 量 ”。 


` 浏览 轨迹 或 热力 图 。 以 上 两 种 方法 都 不 能 真实 的 了 解 用 户 是 否 真 的 “看 了 ”广告 ， 我 们 还 有 第 三 种 方法 眼 动 仪 。 通 过 鼠标 轨迹 图 或 眼 动 仪 做 定性 的 评估 ， 可 以 了 解 用 户 鼠 标 或 者 眼睛 浏览 过 的 页 


面 区域 ， 不 过 由 于 这 种 方法 实用 性 和 可 操作 性 较 小 ， 在 此 只 做 简单 提示 以 便 读 者 了 解 。 
通过 以 上 三 种 (主要 是 前 两 种 ) 方法 的 数据 采集 ， 可 以 获得 单 体 坑 位 的 原始 页 面 浏览 量 、 有 效 浏览 量 、 悬 停 浏览 量 的 数据 ， 同 时 通过 曝光 漏斗 做 曝光 分 析 。 


例如 ， 如 果 页 面 浏览 量 很 高 ， 但 有 效 浏 览 量 很 低 ， 需 要 考虑 资源 位 置 的 更 换 ; 如 果 位 置 较 好 的 情况 下 ， 蚌 停 浏览 量 仍然 较 低 ， 那 么 说 明 广 告 形式 吸引 力 和 突出 度 不 足 ， 需 要 改进 广告 形式 、 素 材 设 计 、 


销售 卖点 等 要 素 。 
(2) 流量 引入 能 
单 体 坑 位 的 流量 引入 能 力 通过 引入 的 人 、 人 次 、 次 数 来 评估 ， 这 三 种 类 型 的 指标 可 以 综合 评估 资源 位 在 不 同 层 面 的 价值 贡献 。 
. 人 : 通常 使 用 UV 和 IP 来 评估 有 多 少 人 点 击 了 广告 ， 某 些 情况 下 也 会 使 用 登录 /注册 用 户 数量 来 评估 ; 除了 绝对 人 数 的 数值 ， 人 数 占 比 也 是 重要 的 衡量 指标 。 
. 人 次 : 通常 使 用 Visit 评 估 某 个 时 间 段 内 去 众 的 点 击 数量 ，Visit 占 比 也 是 衡量 指标 。 
次数: 通常 使 用 点 击 量 或 实例 数 评估 绝对 点 击 次 数 ， 该 数据 每 发 生 一 次 记录 一 次 。 


ta 流量 引入 能 力 评估 过 程 中 的 重要 工作 是 恶意 点 击 和 站 内 流量 作 商 识别 ， 除 了 使 用 人 、 人 次 、 次 数 三 个 类 型 的 指标 以 外 ， 通 常 还 会 使 用 地 理 位 置 、 时 间 (星期 、 和 天、 小时、 分钟 ) 等 维度 进行 识 


别 ， 有 关 恶 意 流量 分 析 请 见 第 9 章 9.4.1 关 于 “恶意 流量 分 析 ” 的 内 容 。 
(3) 转化 贡献 价值 


与 流量 引入 能 力 的 评估 类 似 ， 转 化 贡献 价值 也 可 以 从 人 、 人 次 、 次 数 三 个 维度 进行 评估 ， 分 别 包括 单 次 及 汇总 价值 ， 如， 每 /总 UV 点 击 价值 、 每 /总 IP 点 击 价值 、 每 /总 访 次 点 击 价值 、 每 /总 次 点 击 价 
值 。 


人 @@ 记 示 “有 有关 价值 的 定义 通常 包括 两 部 分 : 一 部 分 是 电子 商务 转化 价值 ， 即 在 线 订单 价值 ; 另 一部分 是 目标 转化 价值 ， 如 注册 、 销 售 线索 、 预 售 、 预 订 、 试 驾 、 下 载 等 ， 给 每 一 个 目标 赋 耶 一 个 值 ， 该 
值 与 在 线 订 单价 值 一 起 构成 总 转化 贡献 价值 。 


在 站 内 资源 位 的 转化 价值 贡献 的 分 配 过 程 中 ， 通 常会 面临 这 样 一 个 问题 : 假如 用 户 依次 点 击 了 A、B、C 三 个 资源 位 最 终生 成 订单 ， 该 订单 应 该 如 何 分 配给 各 个 资源 位 ? 通常 ， 在 一 条 转化 路 径 中 有 多 个 
站 内 资源 位 参加 的 情况 下 ， 有 三 种 贡献 分 配 规则 。 


` 规则 一 : 最 终 分 配 规则 ， 这 种 规则 下 用 户 的 订单 全 部 分 配给 资源 位 C。 


` 规则 二 : 起 始 分 配 规 则 ， 这 种 规则 下 用 户 的 订单 全 部 分 配给 资源 位 A。 


. 规则 三 : 线性 分 配 规则 ， 这 种 规则 下 用 户 的 订单 平均 分 配给 三 个 资源 位 ， 即 A、B、C 各 分 0.33。 
虽然 有 多 种 模型 可 供 选 择 ， 但 无 论 哪 种 规则 都 无 法 定义 反映 资源 位 对 商品 订单 的 最 终 贡 献 ， 主 要 影响 因素 如 下 。 
示例 一 : 某 些 资源 位 内 容 没有 价值 属性 ， 其 点 击 后 的 页 面 依 然 没有 转化 属性 。 如 某 个 资源 位 是 文字 链 ， 其 点 击 之 后 进入 活动 介绍 文字 广告 。 


:示例 二 : 某 些 资源 位 内 容 没有 价值 属性 ， 其 点 击 后 的 页 面 才 存 在 转化 属性 。 如 某 个 资源 位 是 广告 位 ， 其 点 击 之 后 进入 商品 活动 页 面 。 


. 示例 三 : 某 些 资源 位 内 容 存在 价值 属性 ， 但 由 于 不 存在 归属 关系 而 无 法 标记 。 如 用 户 点 击 的 商品 可 能 出 现在 站 内 多 个 资源 位 ， 当 用 户 点 击 多 个 资源 位 上 的 相同 商品 时 ， 无 法 准确 标记 用 户 购买 的 是 哪 
个 资源 位 上 的 商品 。 


: 某 些 资源 位 内 容 存 在 价值 属性 ， 即 使 被 标记 ， 用 户 却 购 买 了 别 的 商品 。 如 资源 位 的 商品 ID 为 123， 但 用 户 点 击 了 ID123 后 却 购 买 了 ID 为 456 的 商品 。 


11.2.2 线 : 面向 站 内 流程 的 优化 与 提高 
1. 流 程 的 分 类 
(1) 注册 流程 
注册 流程 是 网 站 的 基础 功能 ， 根 据 注册 场景 可 划分 为 正常 注册 、 快 速 注册 和 联合 注册 等 。 


“ 正常 注册 : 所 有 网 站 的 正常 注册 步骤 ， 进 入 注册 页 面 之 后 开始 填写 注册 信息 、 提 交 注 册 、 激 活 验 证 。 


| 
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. 快速 注册 : 某 些 情况 下 ， 例 如 活动 或 广告 期 间 只 需要 填写 用 户 唯一 识别 信息 ， 即 可 完成 简单 注册 ， 上 日 后 用 户 再 次 登录 时 再 完善 个 人 1 

. 联合 注册 : 以 上 两 种 方式 都 是 直接 在 使 用 网 站 上 进行 注册 的 方式 ， 另 外 一 种 非常 流行 的 方式 是 使 用 联合 账号 注册 。 例 如 ， 使 用 微 博 、 微 信 账 号 登录 网 站 ， 在 第 一 次 登录 时 对 于 网 站 的 意义 就 是 新 注册 
行为 。 在 这 种 情况 下 ， 除 了 通用 的 注册 信息 ， 还 会 包含 联合 网 站 的 ID 信息 等。 

(2) 登录 流程 

登录 流程 根据 发 生 场 景 的 不 同 可 分 为 预 登录 和 后 登录 两 种 。 


* 预 登录 : 用 户 进 入 网 站 时 就 完成 登录 的 场景 称 为 预 登录 ， 这 种 情况 只 发 生 在 登录 后 才能 浏览 或 下 一 步行 动 的 网 站 ， 大 多 数 网 站 都 不 是 强制 预先 登录 的 。 


* 后 登录 : 后 登录 与 预 登录 相对 ， 指 用 户 只 在 需要 时 候 才 登录 的 情况 。 大 多 数 网 站 都 采用 这 种 方式 ， 例 如 将 商品 加 入 购物 车 后 ， 要 继续 完成 订单 就 必须 登录 。 


(3) 购物 流程 
购物 流程 有 多 种 定义 方法 ， 通 常 使 用 的 有 以 下 三 种 方法 : 
:一 是 从 产品 浏览 开始 计算 ， 依 次 经 过 加 入 购物 车 、 结 算 、 提 交 订 单 三 个 步骤， 这 也 是 标准 的 购物 流程 ; 有 些 情况 下 例如 促销 时 会 省 略 其 中 的 某 个 步骤 。 例 如 直接 从 产品 页 到 达 结 算 页 。 

. 二 是 从 着 陆 页 开始 计算 ， 但 由 于 着 陆 页 和 购物 流程 的 其 他 页 面 之 间 可 能 存在 交叉 ， 在 数据 汇总 时 会 有 误差 。 例 如 用 户 的 着 陆 页 可 能 是 产品 页 ， 如 果 从 着 陆 页 开始 计算 ， 那 么 着 陆 页 和 产品 页 都 会 加 1 而 
导致 数据 不 够 科学 。 

. 三 是 某 些 情况 下 ， 购 物流 程 也 会 等 同 于 购物 车 流程 ， 购 物 车 流程 指 的 是 从 加 入 购物 车 、 结 算 到 提交 订单 的 过 程 。 

人 @@ 记 示 “在 正常 情况 下 ， 不 同 流程 环节 之 间 是 一 个 漏斗 关系 ， 上 述 示例 中 的 着 陆 页 就 是 产品 页 ， 会 造成 从 着 陆 页 到 产品 页 之 间 的 漏斗 关系 不 成 立 ， 如 果 大 多 数 着 陆 页 都 是 产品 页 ， 那 么 从 着 陆 页 到 产品 
页 的 转化 率 就 会 非常 高 ， 不 符合 实际 情况 。 

(4) 促销 流程 

促销 流程 指 的 是 从 促销 开始 到 结束 的 整个 流程 ， 包 括 促销 引导 页 、 促 销 主页 面 、 促 销 分 页 面 、 产 品 页 面 ( 非 强制 步骤 ) 、 加 入 购物 车 页 面 ( 非 强制 步骤 ) 、 结 算 页 面 ( 非 强制 步骤 ) 、 提 交 订 单 。 

促销 流程 与 购物 流程 相 比 ， 有 两 个 显著 特征 : 一 是 促销 流程 从 促销 接触 的 最 前 端 开 始 ， 即 促销 引导 页 ; 二 是 购物 流程 中 的 某 些 环节 在 促销 流程 中 可 以 省 略 。 
个 思路 ; 产品 页 面 、 加 入 购物 车 和 结算 页 面 都 不 是 必需 的 ， 某 些 促销 活动 可 以 直接 在 活动 页 面 点 击 并 到 达 结 


促销 引导 页 、 促 销 主 页 面 和 促销 分 页 面 是 促销 流程 的 重要 环节 ， 大 多 数 促销 流程 都 会 沿用 这 
算 甚 至 订单 成 功 页 面 ， 简 化 步骤 的 意义 在 于 : 


减少 用 户 在 中 间 环 节 的 流失 ， 提 高 转化 率 。 
减少 用 户 在 中 间 环 节 的 时 间 消 耗 ， 尤 其 适用 于 秒杀 、 抢 购 类 促销 场景 。 


(5) 其 他 转化 流程 
又 和 流程 与 以 上 类 似 。 


Ni 


除了 以 上 流程 外 ， 不 同 企业 根 据 业 务 需要 还 可 能 包括 斌 用、 预约、 试 驾 、 预 售 等 流程 ， 其 


流程 分 析 根 据 其 开放 性 程度 的 不 同 ， 可 分 为 以 下 两 类 。 


(1) 相对 封闭 的 流程 
步 , 后 - 步 


此 类 流程 以 注册 、 登 录 等 具体 行动 为 转化 目标 ， 不 同 环节 间 具 有 明显 的 序列 关系 。 图 11-1 所 示 为 用 户 需要 完成 注册 流程 ， 必 须 经 过 注册 页 面 、 注 册 成 功 和 激活 成 功 (有 的 网 站 无 须 激活 ) 三 
都 是 基于 前 一 步 成 功 的 前 提 下 产生 的 。 


注册 成 功 


Ee 


图 11-1 注册 流程 转化 示意 图 


对 于 此 类 相对 封闭 的 流程 ， 需 要 重点 分 析 不 同 流 程 环 节 的 转化 完成 情况 ， 以 及 在 没有 完成 的 情况 下 的 流失 去 向 ， 另 外 重点 是 直接 退出 的 原因 分 析 。 如 图 11-1 所 示 的 用 户 从 注册 页 面 开始 没有 到 达 注 册 成 
功 页 面 的 用 户 可 能 流向 A 页 面 、B 页 面 或 者 直接 退出 ， 重 点 分 析 注 册页 面 与 A、B 等 页 面 的 关联 关系 以 及 用 户 直 接 退 出 的 原因 。 


(2) 相对 开放 的 流程 


此 类 流程 以 促销 活动 为 典型 代表 ， 图 11-2 展 示 了 活动 流程 中 包含 的 开放 流程 环节 。 


加 入 购物 车 . 


活动 预 热 贝 面 主 活动 页 面 


子 活动 三 | *f 子 活动 三 结算 提交 订单 |-*{ 在 线 付款 


图 11-2” 菜 活 动 流 程 转化 示意 图 

相 较 于 封闭 的 流程 ， 该 流程 具有 以 下 特点 : 

` 流程 不 再 是 单条 线路 ， 从 主 活动 页 面 开 始 拆 分 成 不 同 的 子 活动 流程 。 

. 不 同 子 活动 的 转化 流程 和 步骤 不 同 ， 且 具有 明显 的 差异 性 。 

整个 流程 没有 一 条 流程 主线 可 以 将 各 个 环节 做 准确 拆 分 
对 于 此 类 流程 的 分 析 会 侧重 于 以 下 几 点 : 

“ 整体 流程 环节 间 基 于 统计 性 的 流程 分 析 。 由 于 流程 不 再 具有 主线 ， 因 此 不 同 流程 间 只 能 进行 数据 汇总 然后 做 流程 完成 率 分 析 。 
“不同 子 流程 间 的 流程 转化 效果 分 析 。 如 图 11-2 中 需要 分 析 每 个 子 活动 的 流程 完成 度 。 

“ 从 流程 拆 分 环节 开始 的 流量 分 配 与 导 流 作用 。 如 图 11-2 中 从 主 活动 页 面 到 不 同 子 活动 页 面 间 的 流量 分 配 和 价值 转化 作用 需要 重点 关注 。 
“ 不 同 子 流程 间 未 完成 转化 的 流量 去 向 以 及 原因 分 析 。 
3. 流 程 的 分 析 方 法 
流程 的 分 析 方 法 通常 以 漏斗 分 析 和 路 径 分 析 为 主 ， 辅 助 以 关联 分 析 。 

(1) 漏斗 分 析 
漏斗 分 析 是 网 站 分 析 的 基本 方法 ， 不 同类 型 的 流程 有 不 同 的 分 析 方 法 。 
第 一 类 : 针对 封闭 流程 的 漏斗 分 析 。 
第 一 步 : 建立 漏斗 节点 。 在 网 站 分 析 工 具 中 使 用 页 面 、 事 件 等 维度 建立 漏斗 节点 。 
第 二 步 : 采集 和 处 理 数据 。 漏 斗 创建 完成 后 只 需要 等 待 数据 的 采集 和 处 理 ， 期 间 可 通过 数据 报告 查看 漏斗 设置 是 否 正确 。 
第 三 步 : 分 析 漏 斗 数据 。 通 过 对 漏斗 各 环节 的 进入 路 径 和 退出 路 径 分 析 漏 斗 转化 率 、 流 失 原因 等 。 


ia 对 于 大 多 数 网 站 分 析 工 具 而 言 ， 只 有 在 漏斗 建立 之 后 产生 漏斗 数据 。 换 匈 话 说， 漏斗 建 立 之 前 的 数据 无 法 被 处 理 。 


这 种 方法 主要 应 用 于 以 访问 为 时 间 区 间 的 漏斗 转化 情况 ， 但 问题 在 于 无 法 分 析 建 立 漏斗 前 的 数据 。 为 解决 这 个 问题 ， 我 们 可 以 使 用 第 二 类 一 一 针对 开放 流程 的 漏斗 分 析 方 法 。 
第 二 类 : 针对 开放 流程 的 漏斗 分 析 。 


漏斗 其 实 是 不 同 环节 间 关 系 的 表现 ， 这 种 关系 可 以 用 页 面 维度 标志 出 来 (即使 是 事件 或 动作 也 可 以 使 用 虚拟 页 面 进行 标记 ) 。 在 页 面 内 容 报表 中 ， 直 接 将 页 面 按照 标记 进行 过 滤 ， 即 可 产生 类 似 于 漏斗 
的 数据 。 


例如 ， 购 物 车 流程 页 可 标记 为 “购物 车 流程 : 加 入 购物 车 ” “购物 车 流程 : 结算 ” “购物 车 流程 : 提交 订单 ”， 在 使 用 页 面 报表 时 只 需 过 滤 “ 购 物 车 流程 ” 即 可 过 滤 出 购物 车 的 漏斗 数据 。 


当然 ， 这 种 方法 的 问题 也 很 明显 一 一 不 同 页 面 间 无 法 表现 出 序列 关系 ， 即 用 户 在 购物 车 页 面 内 的 多 次 重复 访问 都 会 被 记录 汇总 ， 这 样 会 造成 相应 环节 数据 重复 累加 而 影响 数据 的 准确 性 。 另 外 ， 由 于 是 
统计 性 数据 ， 无 法 区 分 出 用 户 沿 着 剩余 流量 完成 的 比例 情况 。 


漏斗 分 析 常 用 的 指标 包括 : 完成 率 、 放 弃 率 、 填 写 率 、 上 一 步 转化 率 和 起 始 转化 率 等 。 
(2) 路 径 分 析 
路 径 分 析 是 分 析 流 程 的 另外 一 种 方法 ， 常 用 的 路 径 包 括 页 面 上 下 游 、 搜 索 词 上 下 游 等 ， 通 过 页 面 路 径 可 以 非常 方便 地 分 析出 用 户 从 某 个 节点 之 后 去 了 其 他 节点 的 情况 。 


图 11-3 所 示 为 页 面 路 径 数 据 图 ， 通 过 这 个 图 我 们 可 以 看 到 用 户 从 某 个 页 面 开始 到 其 他 页 面 的 流量 分 布 。 同 样 ， 也 可 以 分 析 从 某 个 页 面 开始 ， 其 之 前 的 流量 都 来 自 于 哪些 页 面 或 路 径 。 


分 析 注 各 下 
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manners_per_mousecliek 
1.106 页 面 阳光 量 132,1%) ea tabls_manners 
| ”28 页 面 曝光 量 '3,8%) 


themeaes 


16 页 面皮 光量 12,1%) 


已 停止 加 其 他 
363 页 面 曝光 量 (132,89%) 305 页 面 晖 光量 41% 


| manners_ per_ mouUseclick 
51 页 面 曝光 量 (29,3%) 


EE key word search 有 BE | key word search 
manners_per_mouseclick | 207 页 面 曝光 最 i6%) 35 页 面皮 光量 (20,1%) 
A table_manners 
已 停止 | ohne 
”33 页 面皮 光量 (15,9%) EREE | 其 他 
77 页 面皮 光量 144,3%) 


图 11-3 页面 路 径 数 据 图 

(3) 关联 分 析 

除了 以 上 两 种 方法 外 ， 部 分 情况 下 还 会 用 到 页 面 间 的 关联 分 析 结果 ， 这 种 方法 具有 非常 实际 的 应 用 价值 和 特定 场景 。 

页 面 间 的 关联 模型 通常 用 来 分 析 用 户 在 不 同 页 面 间 访 问 的 关联 关系 ， 即 用 户 看 了 A 页 面 之 后 还 会 看 哪个 页 面 ， 是 B、(C 还 是 E? 

图 11-4 所 示 为 Webtrekk 提 供 的 页 面 关 联 分 析 结 果 ， 通 过 该 结果 可 以 找 出 哪些 页 面 之 间 (或 两 个 页 面 之 间 ) 具有 明显 的 序列 访问 关系 。 例 如 用 户 访问 了 dress 页 面 之 后 的 下 一 个 页 面 最 可 能 是 
dress_code。 这 种 特征 有 以 下 几 种 典型 的 应 用 场景 : 

` 站 内 个 性 化 内 容 的 精准 推送 和 用 户 体验 提升 ， 即 “用 户 浏览 了 该 页 面 之 后 还 会 经 常 浏览 ”; 

. 运营 内 容 的 组 合 及 打包 搭配 ; 

:内容 的 关联 推荐 和 销售 提升 ; 

针对 特定 内 容 的 重复 曝光 与 印象 强化 。 

序 嗓 Page Assoclations 


dresskk dress_code 


dress_code - elegant or sport dress_code 

communicationkbkthemes 

at the_ tablelbkthemes 

table_manners_ -lefties_and cutlerykktable_manners - Where to_put your_handbag 
prefix_-_ letter_headerk letters 

table_manners - table as a battlefieldkktable_ manners - fork_ on _ the _ teeth 


companykthemes 


i 一 


table_manners _- table as_ a_ battlefieldhktable_manners -_offsring_bread 


= 
[| 


table_manners - table as a battlefieldkktable_manners - 3ayYimo down reading glasses 


总 计 


图 11-4 ”页面 间 的 关联 分 析 


11.2.3 面 : 面向 整体 网 站 资源 的 价值 最 大 化 


在 做 运营 分 析 时 ， 当 出 发 点 为 公司 整体 时 需要 考虑 如 何 优化 配置 资源 以 使 价值 最 大 化 的 问题 。 整 体 价值 最 大 化 是 通过 对 所 有 资源 的 投入 和 产 出 排列 、 组 合 ， 计 算出 最 优化 的 运营 整体 方案 ， 常 见 的 应 用 


场景 分 为 两 种 : 基于 运营 编辑 的 人 工 组 合 以 及 基于 数据 驱动 的 自动 推荐 。 
1. 基 于 运营 编辑 的 人 工 组 合 
基于 运营 编辑 的 人 工 组 合 指 网 站 编辑 通过 人 工 方 式 进 行 资源 调整 和 优化 ， 以 达到 整体 价值 最 大 化 的 目的 。 


举例 : 现在 有 A、B、C 三 种 商品 ， 运 营 目 的 是 通过 在 首页 焦点 图 上 进行 曝光 来 提升 其 整体 销售 ， 即 三 款 商 品 的 总 销售 额 最 大 化 。 首 页 焦点 图 的 点 击 量 按照 从 高 到 低 依次 排序 为 焦点 图 1、 焦 点 图 2、 焦 点 
图 3， 位 置 和 商品 组 合 的 结果 共 6 种 ， 如 图 11-5 所 示 。 


焦 反 图 1 焦 所 图 2 焦 把 图 3 


图 11-5 ”商品 和 焦点 图 组 合 结果 
如 何 使 用 这 六 种 方法 解决 上 述 问题 ? 
方案 一 : 直接 通过 测试 做 数据 对 照 并 从 中 选择 最 优 方案 。 该 方案 的 应 用 原则 如 下 。 
当 没 有 历史 数据 可 供 参 考 时 ， 这 是 最 优 方法 ; 
` 在 测试 六 种 方案 结果 时 ， 外 部 环境 需要 尽量 保持 一 致 ， 理 想 情 况 下 应 该 同时 上 线 六 种 方案 并 做 随机 测试 ， 但 对 实现 技术 的 要 求 比较 高 。 
方案 二 : 通过 历史 数据 进行 排列 组 合 分 析 ， 找 到 最 大 化 组 合 方案 。 该 方案 的 应 用 原则 如 下 。 
* 图 中 的 每 个 位 置 以 及 每 种 商品 的 预期 流量 数据 是 可 供 分 析 和 参考 的 ; 


. 使 用 数据 建 模 找到 不 同 组 合 中 的 数据 结果 并 确定 最 大 值 。 


2. 基 于 数据 驱动 的 自动 推荐 
基于 数据 驱动 的 自动 推荐 指 所 有 运营 资源 的 调 优 通过 对 用 户 、 网 站 和 资源 的 数据 分 析 挖 握 ， 找 出 不 同 用 户 的 行为 偏好 ， 进 而 有 针对 性 的 推荐 运营 资源 的 方式 。 关 于 本 节 的 全 部 内 容 ， 在 第 12 章 会 做 详细 
剖析 。 


11.3 ”常用 的 网 站 运营 分 析 维 度 
运营 分 析 与 营销 分 析 维 度 相同 ， 也 是 着 眼 于 目标 、 业 务 (运营 ) 、 用 户 、 网 站 、 竞 争 及 其 他 因素 进行 分 析 ， 本 节 将 侧重 于 运营 分 析 的 特殊 关注 点 。 
11.3.1 目标 端 


网 站 运营 通常 具有 明确 的 、 可 衡量 的 目标 ， 衡 量 角 度 涵盖 流量 、 用 户 、 转 化 ， 具 体 包 括 以 下 内 容 。 


“用户: 用 户 登 录 、 注 册 、 特 殊 事件 (如 预定 、 下 载 、 试 轰 、 投 保 等 ) 的 衡量 。 


` 转化 : 通常 是 电子 商务 转化 ， 即 销售 达成 的 衡量 。 


11.3.2 ”运营 端 


网 站 运营 分 析 会 更 加 关注 两 方面 : 一 是 宏观 层面 ， 关 注 整 体 资 源 分 配 、 流 程 完善 和 资源 整合 ， 二 是 微观 层面 ， 关 注 运营 本 身 的 要 素 、 细 节 和 过 程 。 


宏观 层面 分 两 个 维度 : 一 是 网 站 运营 环节 与 公司 其 他 环节 的 横向 分 析 ， 即 关注 不 同 部 门 间 的 协作 、 整 合 关 系 ; 二 是 网 站 运营 自身 流程 的 纵向 分 析 ， 即 不 同 运 营 事 件 之 间 的 关联 影响 及 流程 优化 。 
(1) 横向 分 析 
大 多 数 企 业 的 网 站 活动 都 是 从 运营 开始 ， 然 后 在 其 他 资源 的 支持 下 展开 工作 的 。 

举例 : 以 电子 商务 企业 为 例 ， 以 活动 带 销售 的 特征 非常 明显 。 当 活动 策划 案 确定 之 后 ， 其 他 部 门 需 要 做 以 下 配合 工作 : 

“ 营销 部 门 根据 活动 整体 目标 制定 流量 目标 及 渠道 组 合 策略 ; 

. 运营 部 门 根据 目标 制定 站 内 资源 策略 和 活动 具体 实 

“ 商品 部 门 根 据 活 动 规模 制定 商品 售卖 策略 及 预 估 商品 销售 量 ; 


“ 仓储 部 门 根据 预 估 的 销售 目标 评估 商品 备货 量 以 及 制定 仓储 、 配 送 方案 ; 


. 客服 部 门 根据 活动 细节 制定 用 户 咨询 和 坐席 策略 。 
运营 在 整个 过 程 中 的 作用 侧重 于 整体 协调 和 运营 资源 分 配 ， 分 析 时 主要 侧重 于 以 下 维度 : 

. 整体 运营 考虑 的 要 素 是 否 完备 ， 是 否 忽略 了 重要 因素 。 例 如 站 内 开展 大 型 促销 活动 时 ， 可 能 忽略 网 站 IT 的 支持 尤其 是 流量 高 峰 期 间 网 站 并 发 的 支持 情况 

- 不 同 环节 间 的 配合 是 否 按照 预期 数量 和 质量 完成 。 例 如 虽然 仓储 部 门 有 备货 ， 但 是 由 于 备货 不 够 导致 无 法 下 单 。 


“ 不 同 环节 是 否 按照 预定 的 时 间 顺 利 完 成 流转 。 以 活动 预 热 为 例 ， 预 热 开 始 前 的 站 外 广告 素材 及 站 内 预测 活动 设计 完成 ， 预 热 开 始 时 站 外 开始 投放 广告 、 站 内 同步 上 线 活动 预 热 页 面 、 客 户 同步 开始 接 
是 否 


收 活动 咨询 ， 存在 明显 的 衔接 问题 。 


. 里 程 碑 事件 的 关键 影响 。 对 于 关键 事件 (例如 每 次 活动 的 高 潮 期 间 ) ， 哪 些 环节 是 对 全 局 具有 关键 性 影响 以 及 如 何 影响 的 。 
(2) 纵向 分 析 
纵向 分 析 相 对 于 运营 本 身 而 言 ， 其 内 容 包括 运营 项 目的 策划 、 整 体 排 期 、 活 动 节 奏 的 把 控 和 衔接 及 落地 推动 等 要 素 。 
举例 : 运营 部 门 通 常会 有 年 度 计划 案 ， 在 此 基础 上 会 划分 为 季度 、 月 度 甚 至 周 度 实 施 方案 。 每 个 时 间 点 下 通常 会 包含 多 个 运 莒 事件 并 行 发 生 ， 具 有 相关 性 的 事件 之 间 也 会 存在 衔接 过 渡 关 系 。 


图 11-6 所 示 为 一 个 简单 的 运营 项 目 排 期 图 ， 图 中 每 个 时 间 点 至 少 并 行 了 两 个 运营 事件 ,例如 A1、A2 和 B2，A1 和 B1 都 有 交叉 关系 。 其 中 ，A1 和 A2 属 于 同一 事件 的 两 个 周期 ,具有 明显 的 先后 顺序 以 及 


过 渡 关 系 (图 中 6 月 6 日 和 6 月 7 日 是 过 渡 期 ) ; A1、A2 和 B1、B2 属 于 并 行 的 两 个 事件 。 


A 


BR 在 收尾 


图 11-6 简单 的 运营 项 目 排 期 图 


通常 网 站 规模 越 大 、 运 营 内 容 越 多 ， 并 行 的 运营 项 目 数 越 多 ， 因 此 形成 了 运营 分 析 中 独特 的 纵向 分 析 维 度 : 

` 运营 事件 间 如 何 衔接 ， 前 后 事件 如 何 有 效 串 联 ; 

. 运营 事件 如 何 并 行 开 展 ， 在 增加 活动 的 同时 而 不 至 于 过 多 分 流 ; 

. 运营 事件 的 生命 周期 如 何 把 控 ; 

. 如 何 通 过 时 间 、 事 件 、 活 动 等 因素 调动 用 户 关注 度 ， 保 持 高 频 用 户 曝光 但 不 至 于 产生 负面 抵触 情绪 ; 

.如何 刺激 用 户 一 次 性 购买 的 完成 与 重复 购买 的 产生 等 。 
2. 微 观 层面 
微观 层面 会 关注 以 下 运营 维度 。 

资源 类 型 : 包括 广告 位 、 商 品位 、 活 动 位 、 资 讯 位 等 站 内 资源 ， 还 可 能 包括 会 员 通 道 、 资 源 互 换 、 联 合 运营 等 站 外 资源 。 

资源 排 期 : 所 有 资源 位 的 排 期 ， 起 始 时 间 、 跨 越 时 间 长 度 ; 尤其 是 重要 节假日 的 排 期 ， 如 春节 、 十 一 等 国家 法 定 节假日 ， 周 年 庆 等 企业 节日 ，618、 双 11 等 电 商 节 日 等 。 
` 运营 内 容 : 每 种 资源 位 上 架 的 内 容 、 类 型 等 要 素 。 

` 促销 卖点 : 运营 内 容 上 可 能 引起 用 户 关注 的 要 素 ， 如 降价 、 折 扣 、 买 赠 、 满 减 、VIP 服 务 等 ; 促销 手法 如 关联 销售 、 打 包 促 销 和 组 合 销售 等 。 
“ 资源 位 效果 : 不 同 资源 位 有 不 同 的 引流 效果 ， 重 点 关注 大 型 流量 页 面 以 及 资源 位 。 如 首页 、 焦 点 图 、 横 幅 、Tips、 下 拉 等 异形 资源 效果 。 

` 资源 位 布局 : 同一 页 面 中 多 个 资源 位 之 间 的 相互 影响 关系 ， 焦 点 图 、 顶 部 导航 、 重 点 促销 模块 〈 如 秒杀 ) 资源 的 利用 率 分 析 。 


资源 位 组 合 : 不 同 资源 位 置 及 上 架 内 容 之 间 的 相互 影响 关系 ， 重 点 是 优势 资源 + 为 势 内 容 、 为 势 资源 + 优势 内 容 的 组 合 分 析 。 


11.3.3 “用户 端 


用 户 端的 分 析 维度 同样 包括 用 户 属性 和 用 户 行为 ， 在 此 重点 介绍 用 户 行为 分 析 的 特殊 维度 。 

1. 用 户 群 体 细 分 

不 同 的 用 户 具 有 明显 的 行为 区 别 ， 运 营 分 析 中 会 强调 用 户 群 体 细 分 。 除 了 基于 人 口 属性 、 事 件 和 行为 的 划分 外 ， 还 需要 把 时 间 和 序列 因素 纳入 群体 分 析 过 程 中 。 
示例 1: 定义 “ 先 买 啤酒 后 买 尿 布 ”的 用 户 群 体 。 


在 之 前 的 网 站 运营 分 析 中 ， 我 们 通常 会 定义 “ 买 了 啤酒 然后 又 买 了 尿布 ”的 用 户 群体 ， 这 两 个 事件 通常 是 伴随 发 生 ， 即 在 一 次 行为 中 同时 购买 啤酒 和 尿布 。 但 很 多 事件 可 能 不 是 在 一 次 行为 中 发 生 ， 而 
是 存在 先后 关系 。 


例如 ， 很 多 用 户 不 是 一 次 性 购买 多 个 大 型 家 用 电器 ， 例 如 冰箱 和 洗衣 机 ， 而 是 先 购买 其 中 一 种 ， 然 后 在 接 下 来 的 某 个 时 间 再 购买 另 一 种 。 要 定义 这 种 群体 ， 就 需要 在 定义 时 加 入 时 间或 序列 特征 ， 如 第 
一 次 购买 的 产品 是 冰箱 ， 第 二 次 购买 的 产品 是 洗衣 机 ， 这 两 种 商品 分 别 属 于 不 同 的 时 间 段 且 有 先后 关系 。 


示例 2: 定义 “ 复 购 ” 的 用 户 群 体 。 


几乎 所 有 的 电 商 类 网 站 都 会 定义 重复 购买 的 用 户 ， 而 不 同 的 企业 对 “重复 购买 ”的 定义 有 所 差别 。 以 月 度 复 购 为 例 ， 我 们 可 以 这 样 定 义 复 购 用 户 : 在 本 月 1 日 有 购买 行为 ， 同 时 在 本 月 又 发 生 了 购买 行为 
的 用 户 。 


在 这 个 示例 中 ， 我 们 排除 了 一 类 用 户 一 一 本 月 1 日 没有 购买 过 但 在 本 月 重复 购买 两 次 或 两 次 以 上 的 用 户 。 要 实现 这 个 定义 ， 我 们 需要 将 时 间 维 度 应 用 到 用 户 定 义 中 。 假 设 本 月 为 8 月 ， 图 11-7 所 示 为 通过 
Google Analytics 定 义 月 度 复 购 用 户 。 


过 滤器 包含 ~- ”用户 。 育 列 开始 任何 用 户 互动 ~ 
第 1 步 合 
会 话 日 期 (年 明 则 ) 当日 或 之 前 -~ | 2014 年 7 月 31 昌 ” 回 


且 
交易 次 数 - 按 用 户 - 
之 后 是 .… 


第 2 步 人 


会 古 日 期 【年 月 提 ) 介 于 ~ | 2014 年 8 月 刘 国 | 且 | 2014 年 8 月 3 但 国 


交易 次 数 -~ ， 按 用 户 ~ 


图 11-7 月 度 复 购 用 户 定义 
示例 3: 定义 “ 先 看 了 A 又 看 B” 的 用 户 群体 。 
之 前 我 们 都 是 定义 “看 了 产品 A 并 看 了 产品 B” 的 用 户 ， 但 实际 上 A 和 B 一 定 是 有 先后 关系 的 ， 即 用 户 不 可 能 同时 在 看 A 和 B 页 面 。 图 11-8 所 示 为 通过 Google Analytics 定 义 了 先 看 了 activity1 后 又 看 了 


activity2 的 用 户 群体 。 


央 序 
按 维 发 情况 细 分 您 的 用 户 和 /或 其 会 话 烤 。 


过 滤器 包含 - ”用 户 。 序列 开始 任何 用 户 互动 ~ 


第 14 步 看 
网 向 = 包含 = | jprductiactivity1.html 


之 后 对 接着 是 ~ 


第 2 步 关 


jprductiactivity 2 |html 


图 11-8 先 看 activity1 后 看 activity2 的 用 户 定 义 
人 证 示 除了 以 上 用 法 外 ， 时 间 和 序列 通常 还 用 于 新 用 户 留存 分 析 、 老 用 户 活跃 分 析 、 恶 意 流量 识 别 、 站 内 路 径 和 设计 优化 、KPI 监 控 等 场景 。 


2. 用 户 喜好 特征 

用 户 的 真实 喜好 特征 难以 通过 数据 衡量 ， 原 因 在 于 喜好 是 用 户 的 主观 情感 ， 且 该 情感 可 能 随 着 时 间 的 变化 而 改变 。 例 如 用 户 几 周 前 可 能 还 喜欢 某 款 手 机 ， 但 是 最 近 可 能 已 经 不 喜欢 了 。 即 使 如 此 ， 我 们 
仍然 能 通过 用 户 在 网 站 上 的 蛛丝马迹 找到 用 户 的 喜好 标签 。 

. 单元 素 行为 一 一 点 击 热 力图 、 页 面 事件 、 表 单 、 媒 体 播放 等 ， 通 过 对 关键 元 素 点 击 次 数 的 统计 获得 用 户 的 喜好 特征 。 


` 单 页 面 行为 一 一 来 源 渠 道 及 促销 卖点 、 进 入 页 面 、 退 出 页 面 、 浏 览 最 多 的 页 面 。 通 过 这 些 页 面 的 浏览 量 、 停 留 时 间 等 数据 可 以 发 现 用 户 是 否 具有 明显 的 目标 或 兴趣 。 


“ 多 页 面 行为 一 一 行为 流 路 径 、 页 面 关 联 模 型 。 通 过 路 径 和 关联 发 现 用 户 是 否 具 有 明显 的 路 径 特征 ， 如 果 用 户 频 繁 访问 两 个 类 似 的 商品 ， 说 明 用 户 可 能 在 做 商品 对 比 。 


` 多 访 次 行为 一 一 用 户 生 命 周 期 内 的 行为 。 将 上 述 用 户 行为 的 定义 区 间 扩 大 ， 不 仅 看 单个 访问 内 的 行为 ， 还 将 多 个 访问 做 关联 特征 分 析 。 


11.3.4 网 站 端 
网 站 端 除了 关注 着 陆 页 设计 、 关 键 表单 设计 和 站 内 流程 以 外 ， 还 会 关注 网 站 本 身 对 活动 的 影响 。 


1. 高 并 发 下 的 网 站 IT 支 持 


多 网 站 做 大 型 促销 活动 时 都 存在 一 个 关键 短 板 一 一 在 高 并 发 的 情况 下 ， 网 站 服务 器 会 无 法 正常 访问 甚至 出 现 宕 机 的 情况 ， 这 会 直接 导致 某 些 关键 行为 如 登录 、 注 册 、 提 交 订 单 等 无 法 完成 。 


这 种 问题 会 最 终 导致 网 站 出 现 流量 、 订 单 等 异常 下 降 。 图 11-9 所 示 为 在 5 分 钟 之 前 网 站 流量 出 现 异 常 下 跌 ( 相 比 正常 情况 下 降 超过 50%) ， 出 现 这 类 问题 需要 立即 跟 上 IT 人 员 沟 通 是 否 网 站 无 法 正常 访问 。 
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图 11-9 ”网 站 流量 又 降 说 明 图 
多 工具 都 可 以 做 网 站 实时 监控 ,但 这 些 监控 通常 都 是 IT 部 门 进行 的 。 作 为 数据 分 析 师 ， 可 以 使 用 网 站 分 析 工 具 中 的 Real time report (实时 报告 ) 进行 流量 并 发 监控 ， 图 11-9 是 来 源 于 Google 
Analytics 的 实时 报告 
js 流量 的 异常 下 跌 只 有 三 种 原因 : 一 是 网 站 无 法 正常 访问 ; 二 是 站 外 投放 渠道 突然 缩减 或 停止 ; 三 是 监测 代码 丢失 。 
2. 活 动 促 销 功 能 设计 问题 
运营 目标 ， 通 常 需要 IT 部 门 设计 新 功能 以 满足 特殊 活动 的 需求 。 例 如 ,抽奖 、 转 盘 等 特殊 道具 以 及 大 型 站 内 游戏 等 ， 针 对 这 些 环节 需要 做 以 下 分 析 : 
. 活动 游戏 参与 度 。 用 户 对 活动 中 游戏 多 个 环节 的 参与 程度 ， 重 点 是 不 同 环节 的 升级 及 流失 。 


* 活动 任务 难度 分 析 。 某 些 大 型 活动 的 任务 往往 具有 参与 时 间 长 、 范 围 广 的 特点 ， 过 于 复杂 或 耗 时 耗 力 的 任务 会 让 用 户 放弃 。 


. 活动 道具 分 析 。 某 些 活动 道具 设计 不 合理 ， 导 致 用 户 难以 理解 或 用 户 无 法 获取 。 


11.3.5 “竞争 端 


竞争 对 手 的 网 站 运营 同样 会 对 企业 内 部 运营 产生 重大 影响 。 
.从 宏观 角度 看 ， 需 要 分 析 竞 争 对 手 运营 策略 、 定 价 策略 、 排 期 策略 、 和 营销 策略 等 以 便 制 定 有 针对 性 的 实施 方案 。 


:从 微观 角度 看 ， 竞 争 对 手 网 站 上 存在 的 显 性 因素 如 产品 价格 、 上 库存、 销量， 活动 时 间 、 参 与 商品 ， 促 销 策略 等 因素 ， 很 可 能 成 为 我 们 可 以 利用 的 突破 点 。 


11.3.6 “其 他 因素 
除 以 上 常见 的 分 析 维 度 和 因素 外 ， 网 站 运营 也 有 一 些 特殊 场景 需要 关注 。 


1. 新 资源 扶持 
会 需求 新 的 业务 点 来 拓展 收入 渠道 、 增 加 自身 防御 能 高 市 场 份额 或 实现 核心 目标 用 户 的 完整 覆盖 。 此 时 ， 网 站 的 部 分 运营 资源 会 用 


不 同 企业 有 不 同 的 竞争 优势 ， 但 在 保持 核心 优势 的 基础 上 企业 
类 调整 到 第 一 的 位 置 。 


来 扶持 新 业务 发 展 。 图 11-10 所 示 为 某 企业 的 核心 竞争 优势 是 3C 商 品 ， 为 了 支持 图 书 和 音箱 业务 发 展 ， 网 站 导航 中 将 “图 书 、 音 像 、 数 字 商 品 ”品类 
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图 11-10 新 业务 导致 资源 支持 


测试 性 投入 是 企业 领导 层 的 站 内 测试 ， 即 领导 层 自身 不 确认 该 业务 是 否 能 产生 良好 的 效果 ， 只 是 通过 内 部 资源 的 测试 性 投入 做 效果 判断 。 图 11-11 所 示 为 主打 大 家 电 品类 的 企业 ， 用 测试 性 的 投入 资源 
建立 超市 类 业务 。 
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图 11-11 测试 性 业务 投入 支持 


理解 了 以 上 两 类 场景 ， 相 信 很 多 读者 就 会 理解 “为 什么 效果 不 好 的 内 容 还 是 会 占据 优势 资源 位 ”， 在 做 网 站 运营 、 站 内 资源 分 析 及 效果 评估 时 会 更 有 针对 性 及 方向 性 。 


本 节 将 介绍 网 站 运营 辅助 决策 的 四 大 案例 : 站 内 广告 位 效果 标杆 管理 、 网 站 用 户 调研 、 站 内 活动 分 析 和 商品 销售 诊断 。 这 些 内 容 涵盖 了 网 站 运营 分 析 的 四 类 核心 对 象 : 资源 位 、 用 户 、 活 动 和 商品 ， 相 
信 读 者 读 完 之 后 会 对 运 莒 专项 分 析 拥 有 比较 清晰 的 轮廓 。 


案例 中 的 相关 数据 均 为 演示 之 用 且 经 过 处 理 。 


站 内 广告 位 效果 标杆 管理 是 运营 管理 的 重要 内 容 ， 同 时 也 是 运营 团队 进行 资源 评估 、 效 果 优化 和 内 容 审 核 的 重要 参考 依据 。 现 在 需要 针对 首页 广告 位 制定 效果 标杆 。 


供 解 折 运营 中 的 所 有 常规 性 工作 都 可 以 制定 效果 标杆 ， 除 广告 位 外 ， 站 外 其 他 的 运营 资源 位 如 商品 位 、 活 动 位 、 推 荐 位 、 咨 询 位 等 国定 位 置 也 都 适用 。 另 外 ， 这 也 适用 于 常规 性 的 专题 活动 、 站 内 运 
营 事 件 等 。 由 于 标杆 的 制定 需要 大 量 历 史 数 据 做 积累 ， 因 此 不 适合 临时 性 、 突 发 性 的 事件 。 


2. 前 期 沟通 


接 到 数据 需求 后 ， 数 据 部 门 提 出 了 以 下 几 个 问题 。 
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问题 一 : 首页 广告 位 是 


.问题 二 :如 果 忆 ; 安 经 有 监 监 测 ， 都 可 以 监测 到 哪 些 数据 ? 


. 问题 三 : 业务 部 门 希望 在 效果 标杆 中 包括 哪些 因素 、 效 果 或 目标 ? 


:问题 四 : 是 否 存在 重点 资源 位 需要 分 内 容 制 定 标杆 呢 ? 


龟 争 析 在 通常 睛 况 下 ， 如 果 是 数据 部 门 负 责 网 站 监测 工作 的 实施 ， 那 么 前 两 个 问题 都 有 答案 ， 如 果 不 是 ， 那 就 需要 中 运营 、 技 术 实 施 部 门 一 起 沟通 确认 ; 第 三 个 问题 的 核心 是 了 解 运营 最 关注 的 核心 
效果 或 指标 ; 第 四 个 问题 是 根据 经 验 ， 重 点 资源 位 通常 会 有 多 种 运营 内 容 ， 针 对 这 些 内 容 可 能 有 不 同 的 标杆 策略 。 注 意 : 不 是 所 有 的 资源 位 都 需要 细 分 ， 细 分 通常 只 针对 重点 或 核心 资源 位 。 


二 与 业务 部 门 的 沟通 确认 ， 其 结果 如 下 。 
:问题 一 : 首页 广告 位 全 部 已 经 通过 代码 监测 。 
问题 二 : 广告 位 可 以 监测 到 点 击 以 及 之 后 形成 的 订单 转化 。 
` 问题 三 : 运营 部 门 主要 侧重 于 引流 和 销售 贡献 作用 。 
问题 四 : 顶部 通栏 广告 是 首页 广告 的 核心 ， 需 要 根据 活动 类 型 细 分 标杆 。 
3. 数 据 准 备 


制定 效果 标杆 时 的 源 数 据 通常 需要 选取 时 间 较 近 、 时 间 范 围 较 长 ， 建 议 选择 1~ 3 个 月 的 数据 。 本 例 为 了 方便 数据 展示 ， 仪 选择 1 周 数据 做 演示 。 数 据 提 取 工 具 是 网 站 分 析 工 具 ， 导 出 数据 后 进行 数据 审查 
和 校 验 ， 主 要 方面 包括 : 


" 异常 值 ， 是 否 存 在 明显 不 合理 的 极 大 值 或 极 小 值 。 
* 缺失 值 ， 是 否 有 字段 的 值 缺 失 《 网 站 分 析 工 具 中 通常 不 显示 指标 为 0 的 维度 ， 这 种 现象 类 似 于 缺失 值 ) 。 
. 无 效 值 ， 对 于 点 击 量 、 订 单 量 等 数值 型 指标 ， 是 否 存 在 字符 型 等 其 他 类 型 值 。 
经 过 排查 ， 有 以 下 几 个 值得 到 处 理 : 
代号 为 A01-X1 在 7 月 8 日 以 及 代号 为 A01-X3 在 7 月 25 日 当天 的 订单 量 异 常 增 大 
" 代号 为 C01-Z3 在 8 月 2 日 当天 的 订单 量 异 常 增 大 


对 于 以 上 异常 变化 的 资源 位 ， 经 过 跟 运 营 部 门 的 沟通 ， 流 量 增加 的 两 个 广告 位 由 于 新 上 了 重点 活动 ， 导 致 整体 订单 效果 较 好 ; C01-Z3 当 天 在 代码 实施 过 程 中 ， 由 于 站 内 其 他 多 个 资源 位 误 用 代码 导致 无 
效 数据 的 增加 ， 去 除 其 他 位 置 历史 数据 后 ， 该 位 置 的 流量 约 为 43932。 


蝶 钾 折 通过 手动 添加 的 监测 代码 容易 产生 代码 漏 加 、 多 加 甚至 重复 引用 的 情况 ， 该 问题 可 通过 数据 的 极 值 表现 进行 预 判 。 


在 观察 原始 数据 时 ， 数 据 部 门 还 发 现 一 个 问题 : 由 于 代码 监测 的 规则 是 以 位 置 + 活动 的 形式 实施 ， 因 此 同一 个 位 置 会 在 不 同 的 时 间 出 现 不 同 的 广告 。 以 A01 广 告 为 例 ， 在 最 近 一 个 月 的 时 间 内 广告 排 期 分 
别 如 表 11-1 所 示 。 


表 11-1 A01 广 告 位 的 不 同 广告 排 期 


活动 代码 广告 上 架 时 间 广告 下 架 时 间 持续 时 间 / 天 


X4 Ll 7 有 115| 4 
X2 7 月 15 日 7 月 23 日 8 
X3 7 月 24 日 8 月 2 日 9 


因此 ， 在 针对 位 置 的 标杆 分 析 时 ， 需 要 将 不 同 活动 的 数据 合并 才能 得 到 位 置 的 真正 数据 ， 另 一 方面 ， 我 们 也 能 发 现 即 使 广告 下 架 仍 然 能 获得 少量 的 点 击 量 ， 这 些 数据 大 多 由 于 历史 缓存 、 用 户 收 藏 、 内 
部 测试 等 产生 ， 在 此 忽略 。 其 中 有 一 天 (7 月 15 日 ) 两 个 活动 都 有 较 高 的 数据 ， 原 因 是 两 个 活动 分 别 上 架 了 半天 的 时 间 ， 即 素材 的 更 换 不 是 以 整 点 为 单位 的 ， 因 此 当天 的 数据 需要 合并 。 


数据 预 处 理 完成 后 ， 得 到 了 可 供 做 标杆 的 数据 ， 如 表 11-2 所 示 为 A01 广 告 位 置 数据 。 


表 11-2 A01 广 告 位 置 数 据 


代 奏 i 动 日 期 点 击 量 订 单 量 


A01 X1 83 437 304 
A01l X1 2 了] 302 
A01 xl 97 400 414 
A01 X1 105 928 438 
A01 X1 220 320 1371 
A01 7 月 9 日 226 676 995 
A01 7 月 10 日 143 751 637 
A01 X4 7 月 11 日 32 594 197 
A01 7 月 13 日 81 731 485 
A01 X4 7 月 14 日 432 
A01 xX 7 月 16 晶 876 


4. 初 步 结论 

在 本 书 的 第 8 章 详细 介绍 过 关于 “下 结论 的 常用 方法 ”， 本 节 将 以 代号 为 A01 的 广告 为 例 ， 使 用 该 方法 制定 数据 标杆 。 

步骤 一 : 使 用 Excel 的 描述 性 统计 计算 均值 、 方 法 和 标准 差 。 (如 果 没 有 启用 该 选项 可 参考 8.1.4 指 数 平滑 中 的 步骤 ) 计算 结果 为 : 均值 为 89324， 标 准 差 为 50422。 
步骤 二 : 计算 数据 正常 波动 区 间 的 上 下 限 ， 在 此 使 用 y+1o (均值 +1 个 标准 差 ) 。 计 算 结果 为 正常 波动 上 限 为 139746， 正 常 波动 下 限 为 38902。 

步骤 三 : 得 出 整体 结论 。 广 告 位 A01 的 均值 是 89324， 即 每 天 能 带 来 89324 点 击 量 ; 同时 ， 其 正常 波动 范围 是 38902~139746。 

用 同样 的 方法 可 得 到 关于 订单 量 的 标杆 数据 。 


全 尘 癌 在 建立 标杆 的 过 程 中 ， 由 于 均值 极 易 受 极 值 的 影响 ， 因 此 当 数 据 间 差 异性 较 大 时 ， 可 综合 考虑 中 位 数 、 众 数 选择 可 靠 值 。 术 案例 中 没有 众 数 ， 而 中 位 数 为 88594， 均 值 与 中 位 数 的 差异 较 小 ， 
说 明 均 值 结 果 较 为 理想 。 


5. 深 入 分 析 
通过 以 上 分 析 似 乎 得 出 了 针对 A01 广 告 位 的 数据 标杆 结论 ， 但 这 个 结论 存在 一 定 的 应 用 条 件 : 在 广告 位 位 置 、 自 身 展示 形式 等 内 在 因素 不 变 的 情况 下 ， 至 少 需要 考虑 以 下 三 方面 因素 。 
(1) 页 面 流量 规模 


页 面 流 量规 模 是 影响 该 页 面 所 有 元 素 点 击 的 最 重要 的 因素 之 一 。 页 面 流量 越 大 ， 广 告 位 被 点 击 的 次 数 可 能 越 多 。 因 此 ， 在 使 用 这 个 结论 时 需要 验证 评估 周期 内 页 面 流量 的 波动 范围 。 这 个 数据 直接 通过 
页 面 流量 (PV 量 报表 ) 报表 即 可 获得 ， 其 页 面 流量 波动 范围 是 650000~ 1820000。 


(2) 页 面 流量 结构 


仅 有 流量 规模 还 不 够 ， 即 使 在 相同 的 流量 规模 下 ， 如 果 流 量 结构 改变 会 意味 着 用 户 属性 和 行为 的 改变 ， 从 而 影响 广告 点 击 。 因 此 ， 需 要 针对 该 页 面 做 流量 结构 分 析 ， 该 分 析 结 论 可 直接 通过 页 面 报表 碍 
看 流量 来 源 。 经 过 分 析 后 的 流量 结构 为 : 直接 输入 28%、SEM26%、CPS19%、 社 交 媒 体 9%、EDM8%， 其 他 10%。 


(3) 广告 位 活动 因素 
对 站 内 广告 点 击 影响 最 重要 的 另外 一 个 因素 是 广告 内 容 ， 即 广告 位 上 不 同类 型 的 内 容 会 直接 影响 用 户 点 击 。 例 如 ， 如 果 网 站 的 核心 用 户 是 3C 类 群体 ， 那 么 3C 类 广告 的 点 击 会 高 于 其 他 品类 。 


关于 A01 (首页 顶部 通栏 ) 广告 位 的 数据 标杆 总 结 : 在 原始 处 理 过 程 中 发 现 ， 广 告 位 A01 一 共 上 架 了 四 个 活动 ， 这 四 个 广告 按照 运营 内 容 可 分 为 三 类 : 第 一 类 是 3C 类 广告 (X3 广 告 ) ; 第 二 类 是 小 家 电 
类 广告 (X1、X4) ; 第 三 类 是 百货 类 广告 (X2) 。 不 同 品 类 的 数据 标杆 如 下 〈 仅 以 点 击 量 标杆 为 例 说 明 ) 。 


“ 3C 类 广告 位 点 击 的 标杆 数据 为 : 均值 147669， 点 击 量 正常 波动 范围 是 130906~164432。 
. 小 家 电 类 广告 位 点 击 的 标杆 数据 为 : 均值 854637， 点 击 量 正常 波动 范围 是 71872~97401。 
. 百货 类 广告 位 点 击 的 标杆 数据 为 : 均值 23423， 点 击 量 正常 波动 范围 是 16267~30579。 
人 至此， 我们 已 经 建立 了 针对 广告 位 A01 的 数据 标杆 ， 其 他 位 置 标杆 的 建立 方法 类 似 。 
6 .沟通 落地 
首页 的 广告 位 数据 标杆 建立 完成 后 ， 可 实现 三 方面 应 用 落地 : 
. HR 部 门 针 对 这 些 广告 位 建立 针对 包含 站 内 广告 设计 、 网 站 运营 、 活 动 策划 在 内 的 对 广告 位 负责 部 门 的 KPI 机 制 。 


“ 在 做 广告 位 运营 的 过 程 中 实时 监测 广告 数据 ， 如 果 出 现 异常 值 超出 预警 下 限 的 异常 值 时 ， 在 排除 其 他 问题 之 后 立即 做 下 架 处 理 ， 要 建立 良好 的 运营 规则 和 处 理 机 制 ; 当 广 告 位 流量 异常 大 并 超出 正常 
范围 值 时 ， 排 查 站 内 是 否 存 在 其 他 代码 误 用 的 问题 。 


* 在 针对 运营 部 门 的 日 常 报 表 中 ， 增 加 广告 位 的 预警 及 针对 标杆 的 数据 内 容 ， 及 时 了 解 运营 内 容 与 标杆 的 差异 点 及 原因 所 在 ， 并 及 时 找到 改进 方向 。 


四 注意 随 着 企业 的 不 断 发 展 及 新 业务 的 优化 ， 数 据 标 杆 需要 做 动态 更 新 ， 从 而 跟 上 企业 发 展 的 脚步 ， 这 也 是 数据 生命 周期 管理 的 一 部 分 


11.4.2 ”网 站 用 户 调研 


用 户 调 研 是 网 站 运营 分 析 的 重要 内 容 ， 业 务 部 门 希 望 能 通过 对 用 户 的 调研 数据 进行 分 析 ， 了 解 真实 的 用 户 信息 ， 包 括 人 口 属性 和 行为 喜好 等 特征 。 


isa 示 用 户 调研 分 析 的 结论 应 用 广泛 ， 是 企业 内 部 各 个 围绕 用 户 运营 的 部 门 普遍 关注 的 数据 之 一 。 因 此 用 户 调研 分 析 的 结论 通常 发 起 于 一 个 部 门 ， 但 供 多 个 部 门 做 决策 使 用 。 


2. 前 期 沟通 

数据 部 门 针 对 这 一 需求 提出 了 以 下 细 化 需 

:人口 基 本 特征 ， 包 括 性 别 、 年 龄 、 收 入 、 职 业 和 地 域 等 基本 属性 ; 
' 购物 偏好 行为 ， 包 括 购 买 习惯 、 购 买 原因 以 及 影响 其 成 单 的 原因 ; 
广告 认 知 调研 ， 针 对 站 外 广告 接触 点 、 接 受 程度 等 进行 分 析 ; 


` 品牌 认 知 分 析 ， 针 对 现 有 的 知名 电 商 的 喜好 度 及 其 原因 的 探 完 。 


Oi 用 户 调研 可 以 涉及 的 内 容 非 常 多 ， 上 述 内 容 仅 涵 盖 了 特定 的 研究 课题 。 通 常 ， 一 份 问卷 中 包含 过 多 信息 会 极 大 地 影响 问卷 调研 结果 ， 当 调研 需求 较 多 时 建议 分 成 几 个 问卷 。 


3. 数 据 准备 
调研 数据 的 来 源 通 常 是 调研 问卷 系统 ， 但 在 此 之 前 需要 有 一 套 调研 问卷 来 收集 数据 。 关 于 调研 问卷 的 设计 样本 见 配套 资源 文件 ?2， 原 始 调研 问卷 详细 数据 见 配套 资源 文件 原始 数据 Excel。 


数据 的 基本 验证 中 关于 数据 缺失 值 、 异 常 值 、 错 误 值 等 的 验证 在 本 书 多 处 介绍 过 ， 在 此 略 过 。 这 里 介绍 通过 数据 间 的 逻辑 进行 数据 审查 的 方法 。 


用 户 所 选 地 域 与 的 匹配 关系 。 原 始 数 据 中 每 个 用 户 都 会 选择 所 在 地 域 ， 同 时 调研 工具 也 会 采集 其 IP 地 址 ， 通 过 IP 地 址 库 可 以 匹配 到 用 户 的 “网 络 ”地 域 信息 ， 将 这 两 个 信息 进行 对 比 即 可 了 解 用 户 


所 选 地 域 是 否 正确 。 


加 滞 为 了 用 户 隐私 安全 ， 本 示例 的 原始 数据 中 已 经 将 用 户 IP 地 址 删除 ， 同 时 其 ID 也 已 经 匿名 化 。 另 外 ， 通 过 IP 确 认 用 户 地 理 位 置 的 方法 需要 企业 具备 较 高 精度 的 IP 地 址 库 ， 否 则 匹配 后 的 信息 可 能 


会 产生 极 大 的 误导 性 。 
. 问题 间 的 继承 关系 。 本 调研 问卷 的 11 和 12 题 分 别 是 “您 在 以 下 哪些 网 上 商城 购买 过 产品 ? (多 选 ) ”“ 以 下 网 上 商城 中 您 最 常 在 哪 家 购买 产品 ? ( 单 选 ) ”。 假 如 在 第 12 题 中 选择 了 答案 A， 说 明 用 


户 最 经 常 在 A 网 站 购物 ; 但 如 果 在 第 11 题 中 没有 选择 A， 即 没有 在 A 网 站 购 过 物 ， 那 么 两 道 题 的 结论 存在 矛盾 关系 。 


合 尘 总 问题 间 的 继承 关系 还 表现 在 强制 跳 转 ， 常 见于 当 用 户 选 择 不 同 答案 时 跳 转 到 不 同 的 题目 。 典 型 应 用 场景 是 针对 不 同 选项 的 用 户 做 分 群 调研 。 例 如 购物 会 员 与 非 购物 会 员 的 调研 。 假 如 题目 之 间 


出 现 明 显 的 冲突 ， 说 明 数 据 采集 出 现 问 题 。 


另外 ， 问 卷 调研 过 程 中 的 很 多 因素 也 会 影响 数据 采集 质量 ， 例 如 : 


` 问卷 投放 的 媒体 平台 。 如 果 问 卷 投放 的 平台 来 源 与 网 站 基本 流量 结构 不 相符 ， 那 么 数据 一 定 会 出 现 问题 。 假 如 网 站 的 流量 主要 来 源 于 SEM， 如 果 投 放 的 平台 是 一 个 广告 类 平台 ， 那 么 不 同 平台 下 采集 


到 的 问卷 结果 必然 差异 性 很 大 ， 影 响 结论 的 可 信 度 。 


' 结果 选项 间 的 序列 关系 。 以 本 调研 第 11 题 为 例 ， 假 如 其 中 的 7 个 选项 的 排序 定 的 ， 那 么 按照 一 般 用 户 的 浏览 规律 ， 排 在 顶部 的 选项 被 用 户 看 到 的 概率 较 高 ， 存 在 更 多 被 用 户 选择 的 可 能 性 。 


: 引导 性 的 问题 。 如 果 问 卷 中 出 现 明 显 的 引导 性 话语 也 将 会 直接 影响 对 用 户 结果 的 判断 和 选择 。 
结果 选项 间 的 交叉 关系 。 如 果 结 果 选 项 间 存 在 交叉 ， 那 么 会 对 用 户 的 选择 造成 影响 。 例 如 对 于 用 户 年 龄 的 调研 中 有 两 个 选项 分 别 是 18~24 岁 、24~30 岁 ， 年 龄 为 24 岁 的 用 户 就 会 无 法 选择 ; 更 重要 的 
是 ， 如 果 出 现 类 似 对 用 户 收入 的 选项 中 存在 两 个 交叉 如 1500~3000 元 、3000~5000 元 ,假如 用 户 收 入 为 3000 元 ， 大 多 数 用 户 会 由 于 被 认可 的 心理 需求 而 选择 3000~5000 元 。 


目 间 的 跳 转 关 系 。 如 上 文 所 说 ， 如 果 需 要 对 不 同类 别 的 用 户 分 别 展 开 调 研 ， 那 么 结果 将 首先 分 为 两 部 分 ， 然 后 分 别 对 两 部 分 数据 进行 分 析 。 


` 题目 的 强制 性 。 调 研 问卷 中 的 一 个 显著 特点 是 有 些 题目 是 选 填 的 ， 如 果 这 类 题目 过 多 会 导致 用 户 采 集 信息 的 减少 ;而 如 果 问 卷 中 由 于 问题 过 多 而 强制 用 户 全 部 必 填 ， 也 会 影响 用 户 完成 问卷 的 体验 ， 


从 而 导致 完整 数据 样本 过 少 。 


4. 初 步 结论 
完成 数据 审查 后 ， 接 下 来 我 们 开始 进行 用 户 调研 结果 的 分 析 。 在 本 阶段 我 们 主要 通过 统计 性 描述 的 方法 对 用 户 的 基本 情况 进行 汇总 分 析 。 


人 @@ 汪 去” 很 多 读者 可 能 认为 江 总 性 的 统计 结果 意义 不 大 ， 但 实际 上 汇总 分 析 是 对 事物 进行 认 知 的 必要 过 程 ， 而 且 是 做 深入 分 析 的 前 提 ， 能 在 汇总 分 析 中 提炼 出 重点 和 高 价值 的 数据 ， 并 能 简明 扼要 的 江 
报 给 企业 领导 层 ， 是 一 个 分 析 师 必须 具有 的 重要 能 

现 以 Excel 的 数据 透视 表 功 能 为 例 ， 演 示 如 何 进行 数据 汇总 统计 。 

步骤 一 : 选中 要 进行 数据 透视 的 区 域 ， 表 中 为 A1~CQ5822。 


步骤 二 : 依次 选择 项 部 菜单 栏 中 的 “插入 一 数据 透视 表 ”， 在 弹出 的 选项 中 选择 “默认 ” 即 可 ， 如 图 11-12 所 示 。 


图 11-12 ”创建 数据 透视 表 


步骤 三 : 针对 每 个 选项 进行 数据 汇总 统计 ， 以 问题 一 “1 .请 问 您 是 第 几 次 访问 xx 网 ? ( 单 选 ) ”为 例 。 在 行 区 域 选 择 “1. 请 问 您 是 第 几 次 访问 xx 网 ” ( 单 选 ) ”， 在 2> 值 区 域 选 择 用 户 名 ， 左 侧 数据 区 
自动 显示 计算 结果 ， 如 图 11-13 所 示 。 


在 以 小 区 域 回 拒 动 字段 ， 


下 短 选 器 吓 到 


1. 请 问 您 旺 第 几 次 访问 关 网 ? { 单 选 ) ~ 


图 11-13 ”设置 数据 透视 表 字 段 
is 示 在 沁 值 区 域 中 ， 如 果 原 始 数 据 列 是 字符 串 型 ， 默 认 对 数据 进行 计数 处 理 ; 如 果 原 始 数 据 列 为 数值 型 ， 上 默认 情况 下 会 进行 数据 求 和 。 


步骤 四 : 还 原 选项 与 值 的 关系 。 原 始 问 卷 中 的 选项 对 应 关系 如 下 : 


1 一 一 第 一 次 。 
2 一 一 第 二 次 。 
3 一 一 来 过 几 次 。 
4 一 一 经 常 来 。 


由 此 ， 我们 得 到 了 关于 用 户 来 访 次 数 的 分 布 ， 如 图 11-14 所 示 。 


用 户 来 访 次 数 分 布 


= 
16% 
常 二 斌 ， 384 ,7%% 


经 常 来 ，2976， 
5156 


图 11-14 用 户 来 访 次 数 分 布 
按照 相同 的 逻辑 ， 所 有 用 户 的 其 他 属性 和 行为 的 选项 都 可 以 统计 出 基本 数据 。 接 下 来 是 将 数据 结果 进行 分 类 ， 按 照 问卷 设计 的 初衷 以 及 业务 的 需求 ， 可 将 基本 汇总 部 分 分 为 以 下 四 类 。 
用 户 基 本 信息 : 用 户 年 龄 、 性 别 、 收 入 、 学 历 、 行 业 和 职业 信息 ， 题 目 16-22 的 统计 结果 。 
“ 用 户 购 物 特征 : 用 户 购 物 时 间 、 购 买 品类 、 获 得 信息 的 渠道 、 购 买 兴 趣 特 征 ， 题 目 1-8 的 统计 结果 。 
: 用 户 广 告 认 知 : 广告 形式 偏好 、 进 入 来 源 分 布 ， 题 目 9-10 的 统计 结果 。 
:用户 品牌 认 知 : 用 户 对 竞争 对 手 及 企业 品牌 的 认 知 、 用 户 满意 度 ， 题 目 11-15 的 统计 结果 。 
至 此 ,我们 已 经 完成 了 关于 用 户 基本 信息 的 汇总 统计 ， 也 能 通过 这 些 数据 得 到 用 户 的 基本 特征 。 但 是 仅 有 这 些 还 不 够 ， 接 下 来 我 们 需要 通过 其 他 的 方法 得 到 更 深入 的 数据 发 现 。 
5. 深 入 分 析 
(1) 深入 挖掘 一 : 用 户 网 站 重合 度 分 析 
本 节 将 根据 题目 12 的 数据 结果 ， 通 过 关联 模型 计算 出 用 户 在 不 同 网 站 间 的 重复 访问 结果 ， 即 用 户 经 常 在 哪些 网 站 间 重 复 访问 。 具 体 步骤 如 下 。 


步骤 一 : 新 建 一 个 包括 用 户 名 、 题 目 12 的 所 有 答案 列 的 文本 文件 。 为 了 便于 后 期 阅读 ， 将 题目 12 中 相同 的 文字 删除 ， 只 保留 名 称 部 分 。 保 存 为 .txt 文 要， 名 称 为 “网 站 重合 度 分 析 ”， 如 图 11-15 所 示 。 
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图 11-15 保存 为 .txt 文 档 


步骤 二 : 在 Clementine 12 中 新 增 “ 可 变 文件 ”节点 (“ 源 ” 栏 位 中 ) ， 设 置 如 图 11-16 所 示 (重点 是 红色 区 域 部 分 ) 。 
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指定 字段 数 
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去 队 开 关 和 将 展 的 空格 : (中 无 由 诺 由 五 两 青 
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ee Eas 


| | 非 打 FR 中 宇和 宇 wm| 旺 : 


| 茹 证 慎 用 符 个 宇 自 定 琳 他 


图 11-16 ”新 增 “ 可 变 文 件 ” 节 点 设置 


步骤 三 : 新 增 类 型 节点 (位 于 字段 选项 中 ) ， 并 设置 如 图 11-17 所 示 。 


关 型 
无 类 型 
DO 标志 
Dm 标志 
Dm 标志 
oD 标志 
Dm 标志 
0 标志 
DO 标志 


图 11-17 新 增 类 型 节点 


步骤 四 : 新 增 网 络 节点 (位 于 图 形 中 ) ， 并 设置 如 图 11-18 所 示 (重点 是 将 网 站 名 称 拖 入 字段 ， 并 勾 选 “ 只 显示 真 信 标 志 ”) 。 


A 国 值 为: 络 对 值 ， 强 树 接 入 重 
加 网络 | 品 导向 网 络 


重 页 访问 关系 图 


图 11-18 新 增 网 络 节点 


步骤 五 : 新 增 Apriori 节 点 (位 于 建 模 内 ) ， 并 设置 如 图 11-19 所 示 。 其 中 “最 低 条 件 支持 度 ” 设 置 为 20，“ 最 大 前 项 数 ” 设 置 为 2， 这 样 能 在 提高 规则 要 求 的 同时 减少 强 关联 数据 的 项 目 数 ， 便 于 数据 查 
看 。 


& 


模型 名 称 : 〇 自动 @ 自 定 X%| 
使 用 分 区 数据 

慑 低 条 件 支持 度 : 

最 小 规则 置信 和 度 (%); 


号 PPFIOTI 


聚 关 闻 项 类 
人 电台 标志 受 蛙 的 真 值 
优化 : 3 束 度 (内存 


图 11-19 ”设置 关联 节点 


步骤 六 : 渠道 重合 度 分 析 。 首 先 通过 网 络 节点 ， 即 重复 访问 关系 图 节点 查看 不 同 渠道 间 的 关联 关系 ， 为 了 更 好 地 显示 不 同 节点 间 的 强 弱 关系 ， 我 们 进一步 对 显示 结果 进行 调整 。 点击 该 节点 的 选项 ， 
将 “以 下 弱 链 接 ” 设 置 为 2000、“ 以 上 强 链接 ”设置 为 3000， 然 后 单 击 “执行 ”按钮 ， 结 果 如 图 11-20 所 示 。 显 示 了 京东 、 天 猫 、 库 巴 、 亚 马 进 和 苏宁 易 购 之 间 具 有 较 强 的 关联 关系 ， 而 且 关 系 基 本 是 访问 
了 京东 的 用 户 ， 通 常 还 会 访问 天 猫 、 库 吧 、 苏 宁 易 购 和 亚马逊 ， 京 东 的 用 户 覆 盖 面 非常 广 ， 和 其 他 网 站 基本 都 有 交叉 覆盖 关系 。 


在 以 上 内 容 的 基础 上 ， 我 们 使 用 关联 模型 进行 数据 挖掘 。 点 击 步骤 五 中 的 节点 并 执行 ， 然 后 将 右 侧 运 行 结果 拖 入 左 侧面 板 并 双击 打开 ， 数 据 结果 如 图 11-21 所 示 。 


响 库 书 
竹 其 他 (请 举例 说 明 ) ”和 苏 宁 易 购 
辐 天 处 


Ea BB 
S00 1.000 1.200 13o0 1.8600 1.800 2,000 2.200 2,400 2.600 2,800 3.000 3,200 33o00 3600 3,8300 4,.000 


图 11-20 ”关联 图 形 结果 


站 信和 度 和 


天 独 

苏 守 易 购 
下 与 示 
新 重 
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库 巴 
新 生 

苏 守 最 赔 
下 马 菠 
更生 
亚 己 了 


图 11-21 关联 模型 结果 
到 这 里 我 们 就 可 以 将 渠道 间 重 合 访问 特征 总 结 出 来 了 ， 具 体 的 文字 描述 在 此 略 过 。 本 模型 数据 流 请 见 本 书 配套 资源 中 的 附件 6。 
(2) 深入 挖掘 二 : 针对 高 价值 用 户 的 特征 归纳 


在 本 案例 的 原始 数据 中 有 一 个 关键 的 字段 一 一 用 户 名 ， 这 个 字段 是 跟 CRM 系 统 关联 的 主键 。 我 们 可 以 将 调研 问卷 数据 导入 CRM 中 做 进一步 分 析 ， 同 时 也 可 以 将 CRM 中 的 关键 字段 或 目标 字段 导出 。 例 
如 ,我 们 可 以 根据 用 户 的 RFM 得 分 或 活跃 度 得 分 ， 将 用 户 划分 为 几 个 类 别 ， 如 高 价值 用 户 (高 活跃 度 用 户 ) 、 中 价值 用 户 (中 活跃 度 用 户 ) 、 低 价值 用 户 ( 低 活 跃 度 用 户 ) ， 然 后 把 这 几 个 分 类 跟 调研 数据 
结合 ， 以 此 来 做 特定 人 群 的 特征 归纳 。 


例如 ， 针 对 高 价值 用 户 群体 进行 数据 挖掘 的 基本 流程 为 : 在 设置 过 程 中 将 用 户 为 高 价值 类 别 的 人 群 设 为 1， 其 余 设 置 为 0%， 这 样 将 人 群 类 别 设置 为 标志 ( 即 目 标 ) ， 然 后 利用 决策 树 模型 提炼 真 值 为 1 的 
条 件 下 用 户 的 特征 。 由 于 CRM 涉 及 企业 内 部 数据 ， 在 此 不 作 具 体 演示 。 归 纳 的 结论 可 参照 图 11-22。 


分 析 过 程 中 ， 由 于 采用 原始 数据 可 以 对 具有 明显 关系 的 数据 进行 交叉 分 析 ， 例 如 分 析 收 入 与 购买 商品 的 关系 、 性 别 与 购物 体验 满意 度 的 关系 等 ， 这 些 交 义 点 可 应 用 到 汇总 分 析 过 程 中 针对 不 同 节点 间 的 


关系 梳理 ， 
” 他 们 是 准 


25 34 源 
一 ”394% 身 处 一 、 一 线 城 市 
本 科 、 研 究 生 以 上 学 万 
- 收入 万 7 以 上 


” 他 们 的 网 购 习惯 


搜索 5| 敬 和 导航 是 其 主要 人 口 
-购物 合同 患 多 是 在 家 电 礼 剧 上 上 电 国 关 
一 ” 较 高 的 态 IP 纳 府 
一 ”县 第 丰 晤 的 上 网 和 经验， 击 莹 访问 于 多 个 电 疝 网 站 


群体 占 上 28.9% *。 他 们 的 喜好 
-对 于 物流 配送 速度 和 网 站 用 户 体验 的 要 求 较 高 
-大 多数 用 户 会 因为 社交 网 站 的 分 享 而 产生 购买 兴趣 
_ ”会 因为 差 评 、 无 优惠 积分 及 物流 慢 导 致 其 放弃 购买 
图 11-22 ”针对 高 价值 用 户 的 特征 归纳 
但 是 ， 这 还 不 够 。 上 述 只 是 应 用 了 调研 问卷 的 数据 进行 用 户 分 析 ， 除 了 调研 数据 可 用 外 ， 企 业 至 少 还 有 三 方面 的 数据 可 以 使 用 。 


: 一 是 企业 内 部 CRM 数 据 以 及 其 他 用 户 数 据 ， 但 这 些 数据 通常 侧重 于 已 经 注册 甚至 产生 购买 转化 的 用 户 ， 并 侧重 于 用 户 属性 、 订 单 、 客 服 、 退 换 货 、 投 诉 等 数据 。 


时 
dh 
到 


. 二 是 用 户 行为 数据 ， 通 过 用 户 名 可 将 用 户 登 录 或 注册 后 的 行为 与 调研 问卷 行为 进行 关联 ， 通 过 网 站 分 析 系 统 可 进一步 分 析 用 户 的 站 外 来 源 ， 站 内 浏览 、 搜 索 、 事 件 、 订 单 转化 等 行为 ， 
户 特 征 。 


. 三 是 很 多 公开 资源 可 以 提供 关于 用 户 画 像 的 数据 ， 例 如 使 用 百度 指数 ， 可 公开 查询 很 多 企业 的 用 户 画像 ， 其 中 包括 关于 用 户 地 域 、 兴 趣 、 人 口 属性 等 数据 ， 这 些 数 据 也 都 可 以 与 自身 调研 数据 作为 参 
考 共 同 使 用 。 图 11-23 所 示 为 利用 百度 指数 查询 的 某 企业 的 用 户 画像 。 


上 大群 导 性 移 京东 201408-01 至 2014.08-03 ”全国 ”PC 诺 


图 


19 守 及 [下 20~29 守 30~39 守 4 科 -~49 守 


1 下 
1 am 上 


图 11-23 百度 指数 用 户 数据 


6 .沟通 落地 
到 此 为 止 ， 针 对 用 户 调研 的 基本 方法 和 流程 已 经 完成 。 通 过 对 用 户 基本 数据 的 汇总 、 交 叉 分 析 以 及 深入 挖掘 ， 整 个 网 站 的 用 户 画像 基本 已 经 描述 完成 。 


接 下 来 需要 跟 所 有 与 用 户 相关 的 部 门 进行 沟通 ， 相 信 这 些 数 据 对 他 们 的 日 常 工作 都 有 极 大 的 帮助 。 除 了 可 以 应 用 到 围绕 现 有 用 户 特 征 进 行业 务 调整 、 流 程 优化 、 资 源 配置 以 及 各 环节 的 完善 外 ， 还 可 以 
将 用 户 挖掘 的 结论 简明 扼要 的 汇报 给 企业 领导 层 ， 作 为 企业 战略 决策 的 参考 依据 。 


11.4.3 ”站 内 活动 分 析 

1. 专 题 背景 

站 内 活动 分 析 是 所 有 站 内 运营 分 析 的 重要 产 出 点 ， 每 次 大 型 促销 活动 或 事件 发 生 之 后 都 需要 进行 活动 总 结 。 本 案例 就 是 某 大 型 活动 结束 后 进行 的 一 次 常规 性 的 总 结 分 析 。 

2. 前 期 沟通 

在 站 内 活动 分 析 开 始 前 ， 数 据 部 门 与 运营 部 门 详细 沟通 了 以 下 几 个 方面 的 问题 

活动 的 主要 目标 是 什么 ? 

.整个 活动 的 排 期 时 间 表 是 什么 ? 

.整体 活动 的 卖点 以 及 不 同 波 次 的 主打 利益 点 分 别 是 什么 ? 

. 活动 在 站 外 哪些 渠道 有 投放 ， 各 自 的 排 期 、 素 材 、 卖 点 、 着 陆 页 、 标 记 规 则 分 别 是 什么 ?预期 的 流量 是 多 少 ? 
` 站 内 哪些 资源 位 会 对 活动 形成 引流 ， 各 自 的 排 期 、 素 材 (或 内 容 ) 和 标记 规则 是 什么 ? 
参与 的 商品 都 有 哪些 ， 各 自 的 价格 、 折 扣 、 目 标 销售 、 库 存量 (分 地 域 ) 及 各 自 产品 属性 分 别 有 哪 些 可 用 数据 ? 
参与 促销 的 内 部 促销 号 以 及 对 应 的 优惠 券 信息 有 具体 有 哪些 (人 金额、 类 型 、 使 用 规则 、 限 制 规则 等 ) ? 


供 解 折 这 些 问题 沁 盖 了 活动 策划 内 容 的 各 个 要 素 ， 从 整体 出 发 点 和 目标 ， 到 不 同 环节 的 细致 操作 规则 均 有 涉及 。 了 解 了 这 些 内 容 之 后 ， 基 本 上 也 掌握 了 运营 的 规则 和 流程 ， 为 下 一 步 做 活动 分 析 提供 
基础 资料 。 


前 期 沟通 完成 后 ， 有 以 下 几 项 需要 数据 部 门 重点 确认 : 
活动 相关 页 面 ( 主 活动 、 分 会 场 ) 页 面 是 否 有 监测 代码 ; 

重点 按钮 或 位 置 是 否 已 经 监测 ， 包 括 导 航 、 热 卖 区 域 位 置 、 焦 点 图 等 ; 

“ 站 外 广告 投放 是 否 正确 标记 ; 

. 新 的 促销 形式 或 功能 是 否 及 时 上 线 以 及 是 否 存 在 Bug 问 题 ; 

: 活动 高 峰 期 间 的 实时 流量 监控 ， 是 否 存 在 重点 功能 不 可 用 ， 例 如 无 法 登录 、 无 法 下 单 等 。 

侈 租 析 ”这 些 问题 可 以 分 为 两 类 : 一 类 是 对 监测 范围 的 把 关 ， 涵 盖 了 整个 页 面 、 页 面 特殊 元 素 及 动作 、 站 外 广告 等 另 一 类 是 网 站 重要 活动 的 实时 监控 ， 重 点 是 网 站 在 高 并 发 下 的 响应 支持 。 

3. 数 据 准备 

在 数据 准备 阶段 ， 数 据 部 门 需要 有 以 下 几 类 数据 : 

. 推广 操作 数据 ， 包 括 渠 道 、 排 期 、 素 材 、 着 陆 页 、 投 放 链 接 、 标 记 规则 等 ; 如 果 可 能 ， 也 需要 跟 投 放 平 台 或 广告 平台 索取 站 外 广告 曝光 和 点 击 数据 。 

. 运营 操作 数据 ， 包 括 各 个 运营 资源 位 的 位 置 、 排 期 、 素 材 (或 内 容 ) 和 标记 规则 ; 该 数据 是 所 有 操作 的 最 细 粒 度数 据 ， 即 每 次 每 个 位 置 的 上 下 架 都 需要 有 记录 。 
` 站 内 活动 相关 数据 ， 包 括 活动 主页 面 、 分 会 场 的 原始 截图 、 点 击 热力 图 (主要 是 基于 像素 的 热力 图 ) 、 不 同 活动 上 下 架 的 广告 、 商 品 和 时 间 表 数据 。 

. 商品 数据 ， 包 括 参 与 促销 的 商品 、 商 品类 别 、 属 性 、 库 存 、 促 销 价 、 折 扣 等 。 


网 站 流 量 炎 放 据 ， 根据 需求 所 有 的 渠道 、 页 面 、 商品 、 活动 等 数据 。 


. 调研 问卷 数据 ， 通 过 调研 系统 获得 的 关于 活动 的 用 户 反馈 数据 。 
林 音 数据， 包括 订单 金额 、 优 惠 券 金额 、 林 单 状态 、 支 付 状态 、 配 送 数 据 、 地 域 等 。 
. 优惠 券 数 据 ， 包 括 预算 号 、 预 算 信 息 (如 预算 总 金额 ) 、 人 金额 、 类 型 、 使 用 规则 、 限 制 规则 、 生 效 日 期 、 失 效 日 期 等 ， 另 外 还 包括 用 户 网 站 领 券 数 据 。 


: 用 户 数 据 ， 包 括 基 本 人 口 属性 〈 如 性 别 、 年 龄 等 ) 、 购 买 数 据 (如 RFM 数 据 、 购 买 商品 等 ) 、 喜 好 数据 〈 自 商品 喜好 、 价 格 喜好 等 ) 、 标 签 数 据 (通过 数据 挖掘 与 CRM 结 合 提 炼 的 特定 用 户 标签 ， 如 


白 富美 、 高 价值 人 群 等 ) 。 
竞争 对 手相 关 数 据 ， 包 括 活 动 截 图、 活动 资料 收集 、 重 点 推广 资源 监控 、 从 第 三 方 购买 的 竞争 情报 、 自 有 监控 平台 获得 的 数据 。 
以 上 数据 是 完成 一 次 完整 的 促销 活动 分 析 所 需 的 最 少数 据 量 ， 不 同 数据 间 关 联 的 主键 信息 是 渠道 ID、 资 源 位 ID、 活 动 ID、 用 户 I1D、 优 惠 券 ID、 预 算 号 ID、 商 品 ID、 订 单 1D、 配 送 单 1D。 
渠道 ID: 站 外 推广 标记 规则 。 
资源 位 ID: 站 内 运营 资源 位 标记 以 及 活动 页 面 的 资源 ID。 
. 活动 ID: 主 活动 和 不 同 波 次 以 及 分 会 场 活动 的 标记 。 
“ 用 户 ID: 标记 用 户 信 息 。 
. 优惠 券 ID: 优惠 券 识别 标志 。 
预算 号 ID: 识别 与 优惠 券 关 联 的 预算 号 。 
. 商品 ID: 商品 关联 主键 。 
订单 ID: 订单 信息 关联 主键 。 
配送 单 ID: 物流 配送 信息 关联 主键 。 
关于 数据 的 异常 审查 在 此 不 作 歼 述 ， 之 前 的 章节 已 经 多 次 提 到 |。 
4. 初 步 结论 
(1) 第 一 部 分 : 整体 汇总 
站 内 活动 分 析 的 第 一 部 分 是 进行 整体 数据 汇总 ， 即 从 宏观 的 角度 分 析 整 个 活动 效果 。 整 体 汇总 通常 分 为 销售 (转化) 、 用 户 、 流 量 三 个 维度 。 
第 一 步 是 销售 汇总 ， 汇 总 数据 如 表 11-3 所 示 。 


表 11-3 ”整体 销售 数据 


时 间 类 妥 投 订单 基肥 投 金额 /元 “| 大昌 
二 月 198 208 366 143 030 99 956 595 37 


11 月 16 日 171 268 375 135 720 35 

11 月 17 日 

11 月 18 日 704 825 253 566 04. 25 

上 次 活动 当天 380 437 198 630 247 284 35 

Fe | | -0 
特殊 数据 解释 : 


常 的 废 单 率 。 基 于 以 往 的 经 验 ， 妥 投 稳定 后 废 单 率 在 30%~40%。 本 次 异常 分 析 为 网 站 的 核心 支付 方式 是 在 线 支付 ， 占 比 69%， 目 前 废 单 率 是 17%。 由 于 在 线 支 付 默 认 24 小 时 失效 (未 支付 下 会 作 
废 ) ， 因 此 数据 时 间 (次 日 早晨 10 点 ) 内 未 到 作废 时 间 ， 导 致 成 单 率 偏 高 。 


* 关于 销售 的 贡献 作用 。 只 从 促销 期 间 的 数据 对 比 来 看 ， 促 销 活动 的 销售 效果 无 疑 是 显著 增长 ， 但 真 的 是 贡献 突出 吗 ? 我 们 来 分 析 下 不 同月 份 销售 额 的 走势 ， 图 11-24 是 不 同月 份 销售 额 标 准 化 《0-1 标准 
化 ) 后 的 走势 。 


从 图 11-24 中 可 以 发 现 ， 所 有 月 份 的 促销 期 间 的 销售 额 增长 迅速 ， 但 当 促 销 结束 后 的 很 长 一 段 时 间 内 ， 网 站 的 销售 持续 低迷 。 说 明了 促销 产生 的 高 峰 销 售 实 际 导 致 了 三 个 负面 结果 : 
. 一 是 提前 透支 了 用 户 的 消费 能 力 ， 使 得 原本 应 该 在 促销 之 后 正常 消费 的 订单 提前 产生 ， 即 透支 了 用 户 的 消费 能 力 。 
. 二 是 将 订单 集中 在 促销 期 间 对 公司 各 个 运营 环节 都 产生 极 大 压力 ， 核 心 是 网 站 订单 配送 能 力 不 足 导致 爆 仓 。 


` 三 是 不 断 的 活动 也 可 能 会 给 用 户 造 成 一 种 消费 习惯 销 就 不 消费 。 


不同 月 份 日 销售 额 走 势 


a 二 月 cs 站 月 ss 站 月 a 2 月 


< : VJ 人 ~ -DC 一 ~ 


1234 25236789 101112 13 1412 1617 18 19 20 21 22 23 24 25 26 21 28 29 30 


图 11-24 不 同月 份 的 日 销售 额 走 势 图 
ii 销售 类 汇总 的 分 析 要 点 : 
1) 看 趋势 ， 核 心 指 标的 变化 及 异常 原因 。 
2) 看 环比 ， 同 是 常规 性 大 促 各 方面 指标 明显 差距 基本 分 析 。 
第 二 步 是 用 户 汇总 ， 汇 总 数据 如 表 11-4 所 示 。 
表 11-4 用 户 汇总 数据 
时 间 新 增 注册 用 户 数 注册 到 购物 转化 率 | 当天 复 购 率 
TI 了 
环比 变化 19% 29% _6% 


特殊 数据 解释 : 
由 于 拉 新 是 用 户 类 需求 的 重点 ， 因 此 在 此 重点 分 析 新 客户 (当天 注册 并 购物 用 户 ) 的 情况 。 
. 地域 无 明显 集中 趋势 。 北 上 广 三 省 用 户 数 仅 占 31%。 


-浏览 商品 


厨 卫 生活 (28.8%) 、 手 机 数码 〈27.1%) 和 家 居 用 品 (22.1%) 最 关注 的 品类 。 电 脑 和 大 电 类 仅 分 列 三 四 位 。 


购买 商品 厨 卫生 活 (14.2%) 、 手 机 数码 (13.6%) 、 家 居 (12.9%) 、 家 纺 (10.8%) 订单 量 靠 前 。 值 得 注意 的 是 家 居 ， 销 售 中 ，49% 是 乐 扣 产品 (74 折 ) ，20% 是 炊 大 师 锅 (3 折 ) 。 核 心 原因 为 
有 抢购 资源 支持 、 折 扣 高 、 单 价 低 、 大 众 消 费 品 。 


格 价格 敏感 度 高 。12.7% 点 击 价格 排序 ， 销 量 排序 仅 占 3.7%。 


的 组 析 用 户 关 汇总 的 分 析 要 点 : 

1) 注册 到 购物 的 转化 漏斗 分 析 。 

2) 典型 用 户 特征 分 析 ， 如 本 案例 中 的 新 客户 是 业务 的 重要 关注 点 。 

3) 如 果 数 据 完整 且 准 确 ， 也 可 以 计算 每 用 户 价值 ， 每 新 增 一 位 用 户 ， 带 来 多 少 订 单 、 多 少 销 信和 额 、 多 少 毛 利 ; 挽回 一 个 用 户 ， 增 加 多 少 订 单 、 多 少 销 信和 额 、 多 少 毛 利 。 


第 三 步 是 流量 汇总 ， 汇 总 数据 如 表 11-5 所 示 。 


| UV | Pv | 六] Fo | RE | UV 成 
A | 876150 | 30376180| 109 | 780 | i4% | 02 
oH | 1843250 | 19597360 | 106 | 69 | 1% | 0 
mH | 19754580 | a53100| 109 | 42 | 1 | 0 
is | 2600530 | 510860G0 | 17 | 39 | 30% | 0 
[次 活动 当天 | 37S31720 | 383999580 | 107 | 10 | 162% 3 
Fee | 2% | mm | mm | om | sm | -am 


特殊 数据 解释 : 


“ 全 站 流量 。 此 次 大 促 UV 环 比 上 个 月 下 降 29%， 但 访问 深度 、ROI 及 转化 率 环比 都 上 升 ， 流 量 质量 提升 ; 活动 重点 主 分 会 场 PV 共 计 61940000 ( 占 全 站 19.9%) ， 主 要 流量 来 源 是 硬 广 (84%) 、BD 陡 航 


(7%) ， 重 点 渠道 是 媒介 1 (23.1%) 、 媒 介 2 (7.6%) 。 


` 活动 主 分 会 场 流量 分 布 。 图 11-25 所 示 为 站 内 页 面 PV 占 比 ， 主 、 分 会 场 流量 严重 不 均衡 ， 存 在 站 内 页 面 引流 和 二 次 分 配 的 重要 问题 。 关 于 该 问题 的 具体 细节 会 在 之 后 的 篇 幅 具 体 介 绍 。 


活动 主 、 分 会 场 PV 占 比 


主 会 场 ” 国 本 时 半 革 灶 灶 灶 灶 灶 灶 | 灶 攻 82% 
** 特 殊 会 场 轩 映 4% 
手机 数码 分 会 场 国 3% 
家 居家 装 分 会 场 国 2% 


电脑 分 会 场 国 2% 
服饰 鞋 帽 分 会 场 国 2% 
彩电 分 会 场 是 1% 
厨 卫 生活 分 会 场 自 1% 
冰 洗 空 分 会 场 目 1% 
食品 百货 分 会 场 是 1% 
健康 医疗 分 会 场 | 1% 


图 11-25 ”活动 主 、 分 会 场 PV 占 比 
Oi 流量 类 汇总 的 分 析 要 点 如 下 。 
1) 营销 流量 情况 及 对 全 站 的 贡献 。 
2) 重点 渠道 : AD、 联 盟 〈 自 建 和 平台 ) 数据 关注 和 分 析 。 


3) 活动 页 面 数 据 : 主 会 场 、 分 会 场 占 比 及 其 异常 分 析 。 


— 


(2) 第 二 部 分 : 活动 引流 分 析 

活动 引流 包括 两 个 方面 的 内 容 : 一 是 站 外 渠道 推广 ; 二 是 站 内 资源 位 支持 。 
1) 站 外 渠道 推广 。 

站 外 渠道 推广 通常 是 活动 引流 的 核心 ， 重 点 分 析 的 维度 包括 : 


` 营销 渠道 的 推广 数量 以 及 质量 衡量 ; 


i 


曾 营 销 梁 道 的 效果 评 舍 ; 


* 标准 评估 维度 和 指标 外 的 特殊 渠道 评估 ， 比 如 EDM 对 于 邮件 发 送 、 达 到 、 点 击 的 评估 效果 ， 微 博 、 微 博 的 转发 、 评 论 、 粉 丝 及 影响 力 、 媒 体 事 件 策划 等 评估 ， 以 及 公关 传播 的 节奏 、 媒 体 接 触 点 、 稿 
件数 量 、 阅 读数 等 评估 。 


关于 渠道 效果 评估 的 基本 流程 ， 请 见 第 9 章 9.4“ 网 站 营销 辅助 决策 四 大 案例 ”。 除 以 上 评估 维度 外 ， 还 可 以 针对 渠道 间 的 订单 归 因 、 重 装 访 问 进行 分 析 ， 目 的 是 在 全 面 评估 每 个 渠道 自身 效果 的 同时 ， 
再 评估 对 其 他 渠道 的 间接 贡献 。 现 以 渠道 间 的 重 革 营销 为 例 ， 分 析 渠 道 的 订单 贡献 特征 及 重 区 访问 特征 。 


打开 Webtrekk 中 的 关联 报表 ， 得 到 如 表 11-6 所 示 的 示例 数据 。 


表 11-6 渠道 关联 访问 数据 


规 和 数 量 支 持 度 置 信 度 


百度 品牌 专区 360 导航 54 87 
hao123 导航 * 金 山 导 航 62 89 
活动 俏销 Email * 巨 雷 86 
媒介 XI1 * 迅 雷 2 81 


从 表 11-6 的 数据 中 可 以 得 到 类 似 的 结论 一 一 某 些 渠道 之 间 存 在 较 强 的 关联 访问 关系 ， 比 如 : 

“ 品牌 区 与 导航 。 

. 活动 营销 Email 与 迅雷 

:媒介 X1 与 迅雷 。 

这 些 渠道 的 重 芭 访问 特征 意义 为 : 用 户 会 经 常 性 的 访问 某 些 关联 渠道 ， 并 形成 关联 访问 习惯 。 例 如 ， 用 户 会 经 常 先 访问 百度 品牌 专区 ， 然 后 再 访问 360 导 航 。 


用 户 的 这 种 行为 对 于 媒介 投放 的 启发 是 : 如 果 要 让 广告 在 多 平台 上 对 同一 个 用 户 产生 重复 曝光 并 希望 用 户 能 够 进入 网 站 ， 就 需要 在 这 些 媒 介 中 同步 投放 广告 。 以 百度 品牌 区 和 360 导 航 为 例 ， 如 果 用 户 
没有 从 百度 品牌 区 获得 相关 信息 ， 那 么 用 户 可 能 不 会 产生 通过 360 进 入 网 站 的 行为 。 


除了 不 同 渠道 间 的 重 赤 访问 特征 之 外 ， 还 可 以 针对 同一 个 渠道 的 重复 访问 进行 分 析 。 通 过 该 报表 直接 过 滤 单 一 渠道 的 重复 访问 数据 即 可 获得 相关 结论 。 关 于 该 方法 请 见 第 9 章 9.4.2 关 于 “多 渠道 订单 归 


2) 站 内 引流 。 
站 内 引流 是 调用 站 内 资源 对 活动 进行 支持 的 一 种 途径 。 通 常 站 内 引流 会 发 生 在 网 站 的 主要 流量 页 面 ， 例 如 首页 、 重 要 列表 页 、 活 动 主 页 等 。 表 11-7 所 示 为 站 内 引流 首页 位 置 的 数据 汇总 。 


表 11-7 站 内 引流 首页 位 置 数据 汇总 


人 A A 
自 页 弹 窗 广告 Em 793 420 

硕 通 244 540 Er 376 100 
省 焦 第 一 帧 282 280 


11 月 15 日 和 16 日 活动 仅 在 首页 弹 窗 广告 、 顶 通 和 首 焦 第 一 帧 进行 预 热 ， 点 击 量 逐 步 上 升 ， 活 动 当天 访问 数 分 别 达到 376100 和 282280 万 ， 是 日 常 水 平 的 1.7 倍 。 从 17 日 开始 ， 首 页 加 入 弹 窗 广 告 ， 活 动 期 
间 引 入 访问 数 高 于 项 通 和 首 焦 第 一 帧 两 个 广告 位 引入 点 击 量 之 和 和 。 异 形 广 告 的 流量 引入 效果 明显 。 


et 
hh 


[> 


a 


从 广告 效果 数据 来 看 ， 活 动 期 间 (11 月 18 日 ) 首 页 流量 增长 35%， 但 点 击 增长 74%， 主 要 原因 是 活动 主题 吸引 力 大 且 广 告 设计 较为 突出 ， 尤 其 新 增 弹 窗 广告 的 关注 度 较 高 。 
(3) 第 三 部 分 : 活动 时 主 、 分 会 场 分 析 

活动 时 主 、 分 会 场 分 析 包 括 活动 时 主页 面 的 点 击 分 布 、 流 量 引 导 及 二 次 分 配 、 活 动 当天 核心 活动 效果 分 析 、 活 动 节奏 和 促销 分 析 等 。 

1) 主 会 场 页 面 点 击 分 析 。 


针对 页 面 的 点 击 监测 ， 可 以 使 用 网 站 分 析 工 具 的 点 击 热力 图 ， 基 于 像素 的 点 击 热力 图 可 以 提供 位 置 热度 报告 ， 基 于 链接 的 覆盖 图 可 以 提供 每 个 链接 的 点 击 数据 ， 但 为 了 更 精准 地 跟踪 每 个 位 置 的 点 击 数 
据 ， 这 里 采用 第 三 种 ， 在 每 个 位 置 通 过 自 定义 代码 监测 点 击 数据 。 


监测 的 基本 思路 是 ， 每 个 位 置 被 点 击 时 触发 一 段 Js 脚 本 ， 并 向 网 站 分 析 服 务 器 发 送 请 求 。 另 外 ， 为 了 更 好 地 记录 位 置 的 原始 状态 ， 最 好 能 够 将 每 个 重点 位 置 的 点 击 内 容 (例如 商品 |D 或 活动 |D) 放 到 监 
测 代码 规则 中 ， 这 样 可 以 方便 地 通过 位 置 与 引流 后 的 内 容 进行 进一步 关联 。 


监测 完成 后 可 以 得 到 如 图 11-26~ 图 11-30 所 示 的 数据 覆盖 图 ， 将 活动 主页 面 的 各 个 楼 层 截 图 ， 然 后 将 点 击 这 数据 覆 盖 在 楼 层 原 图 上 。 


一 一 有 人 日 > ch ~ fy 
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图 11-26 ”活动 主页 首 屏 点 击 率 徐 盖 图 


图 11-27 ”活动 主页 第 二 屏 点 击 率 窗 盖 图 
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图 11-28 ”活动 主页 第 三 屏 点 击 率 履 盖 图 


图 11-29 ”活动 主页 第 四 屏 点 击 率 覆盖 图 


图 11-30 ”活动 主页 第 四 屏 点 击 率 发 盖 图 


为 什么 这 里 要 使 用 一 个 原始 图 + 点 击 率 履 盖 图 而 不 是 直接 使 用 Excel 表 格 ? 这 种 处 理 方法 有 几 个 直观 的 好 处 : 四 这 种 方式 更 易于 业务 人 员 的 理解 ; @@ 不 同 履 盖 图 中 包含 了 位 置信 息 一 楼层 和 屏 
幕 位 置 ; @) 不 同 楼 层 的 内 容 信息 更 易于 观察 ， 例 如 品类 、 主 打 商 品 、 焦 点 图 活动 等 。 


从 页 面 点 击 分 布 位 置 因素 来 看 ， 整 个 页 面 点 击 分 布 从 上 到 下 依次 减少 ， 但 最 后 的 一 个 楼 层 点 击 率 较 页 面 底部 的 点 击 率 下 降 情 况 相 反 ， 略 有 提升 。 


i 这 里 有 一 个 大 陷阱 页 面 点 击 率 高 就 意味 着 是 受 位 置 的 影响 吗 ， 或 者 说 位 置 好 就 一 定点 击 率 高 吗 ? 当然 不 是 ， 商 品 因素 是 影响 点 击 的 另 一 个 关键 点 。 例 如 ， 同 样 是 大 家 电 层 ， 如 果 商 品 是 手 
机 和 数码 ， 用 户 的 点 击 率 还 是 4.7% 吗 ? 如 果 是 食品 百货 呢 ? 肯定 又 会 出 现 另外 一 个 分 布 规律 。 为 了 测试 商品 内 容 对 位 置 的 影响 ， 我 们 需要 通过 A/B 测 试 进行 数据 分 析 : 在 日 常 运营 中 ， 有 意识 的 测试 相同 的 
位 置 放置 不 同 商品 ， 但 选择 商品 的 标准 基本 一 致 ， 例 如 都 不 是 爆 款 、 价 格 没 有 折扣 、 库 存 充 足 、 促 销 语 类 似 等 ， 以 便 判 断 相 同位 置 上 放置 不 同 商品 时 的 用 户 点 击 情况 。 这 种 情况 下 使 用 随机 的 A/B 测 试 效果 
最 好 ， 如 果 没 有 A/B 测 试 的 工作 条 件 ， 也 尽量 选择 渠道 流量 类 似 、 流 量 结构 相同 、 时 间 差 异性 较 小 的 时 间 段 分 别 测试 。 


我 们 通过 测试 得 出 结论 ， 在 相同 情况 下 ， 每 发 生 100 次 点 击 ， 不 同 品类 获得 的 点 击 分 布 如 表 11-8 所 示 。 
表 11-8 相同 位 置 下 A/B 测 试 结果 
品类 / 商品 凡 击 
大 家 电 
3C 效 位 
厨 卫 生活 


人 
食品 百货 


凡 击 率 /% 
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这 个 结果 反映 了 相同 位 置 上 不 同 品类 /商品 的 点 击 喜好 ， 结 合 本 案例 ， 如 何 将 排除 内 容 对 位 置 的 影响 ? 

我 们 以 大 家 电 为 标杆 ， 阐 述 不 同 品类 /品类 与 大 家 电 之 间 的 关系 ， 在 相同 的 位 置 上 ， 其 他 因素 也 基本 一 致 的 前 提 下 ， 放 置 一 个 其 他 品类 的 效果 分 别 如 下 。 
" 大 家 电 : 1 个 大 家 电 。 

. 3C 数 码 : 1.59 个 大 家 电 。 

. 厨 卫 生活 : 1.06 个 大 家 单 。 

“ 食品 百货 : 0.47 个 大 家 电 。 

. 家 居家 装 : 0.76 个 大 家 电 。 

. 服饰 鞋 巾 : 0.47 个 大 家 电 。 

. 健康 医疗 : 0.53 个 大 家 电 。 


通过 其 他 品类 与 大 家 电 之 间 的 比例 关系 即 可 得 到 这 个 数据 ， 这 个 关系 如 何 应 用 到 本 次 的 分 析 案 例 中 ? 我 们 通过 其 他 品类 与 大 家 电 之 间 的 系数 关系 进行 还 原 ， 还 原 的 思路 为 : 如 果 3C 数 码 要 获得 大 家 电 的 
点 击 ， 就 需要 将 3C 数 码 的 点 击 量 /1.59。 还 原 后 的 数据 如 表 11-9 所 示 。 


表 11-9 还 原 后 的 A/B 测 试 数据 
品类 / 商品 页 面 楼 层 点 击 率 /9%% 还 原 系 数 还 原 后 点 击 率 /% 


食品 百 贷 3.00 2.13 6.4 
服饰 埋 帽 1.50 分 二流 尝 演 
健康 医疗 2.70 1.89 3.0 
还 原 后 的 结果 说 明 ， 如 果 所 有 商品 区 楼 层 位 置 的 商品 都 是 大 家 电 ， 那 么 其 点 击 率 分 布 应 该 是 按照 4.7%、4.1%、、4.1%、6.4%、3.8%、3.2%、3.0% 的 规律 分 布 ， 这 个 数据 基本 说 明了 点 击 率 从 上 到 下 


依次 递减 的 规律 ， 且 递减 结果 理论 上 已 经 不 受 商品 自身 的 因素 影响 了 。 
但 是 在 递减 规律 中 有 两 个 是 在 原始 数据 中 未 曾 发 现 的 现象 : 
“ 递减 规律 并 没有 原始 数据 显示 的 那么 明显 ; 
数据 中 仍然 发 现 异常 点 6.49%。 
第 二 个 异常 值 说 明了 原始 数据 本 身 存在 一 定 的 问题 ， 接 下 来 就 需要 找到 问题 的 根源 。 


6.4% 对 应 的 楼 层 区 是 食品 百货 区 ， 通 过 与 业务 方 沟通 以 及 对 食品 百货 区 的 点 击 和 订单 分 析 发 现 : 食品 百货 区 售卖 了 大 量 的 x x 纸巾 ， 而 这 些 纸巾 中 96% 的 订单 价格 在 20~30 元 ， 最 重要 的 是 这 些 纸巾 只 
是 在 活动 期 间 才 出 现 ， 之 前 的 订单 比较 稳定 且 订 单 出 货 量 很 少 。 到 底 是 什么 原因 导致 这 些 订单 激增 ? 在 分 析 订 单数 据 时 ， 数 据 部 门 还 发 现 了 一 个 非常 典型 的 特征 ， 这 些 购买 纸巾 的 订单 中 90% 都 使 用 了 优惠 
券 ， 而 且 优 惠 券 的 金额 90% 以 上 都 是 30 元 优惠 券 。 


接 下 来 是 分 析 为 什么 这 些 优 惠 券 会 大 量 应 用 到 这 些 商 品 上 ?通过 核对 运营 的 优惠 券 规则 发 现 了 满 1000 元 返 30 元 的 规则 ， 这 些 优惠 券 可 以 当 现 金 券 使 用 。 通 过 这 个 分 析 ， 大 体 得 到 初步 猜想 : 用 户 可 能 想 
直接 用 掉 这 30 元 的 优惠 券 。 


但 现在 的 问题 是 ， 为 什么 购买 的 产品 集中 在 纸巾 而 不 是 其 他 商品 ， 尤 其 是 其 他 低 价 商品 ”为 此 数据 部 门 查找 了 优惠 券 的 使 用 规则 后 发 现 ， 该 优惠 券 的 使 用 品类 中 限定 的 包括 厨 卫 电器 、 大 家 电 类 和 日 常 
百货 类 ， 这 意味 着 购买 其 他 品类 都 不 能 使 用 该 优惠 券 。 如 果 购 买 厨 卫 电 器 和 大 家 电 类 商品 ， 那 么 用 户 就 需要 额外 再 人 花费 一 定 的 金钱 ， 并 且 对 于 厨 卫 电器 和 大 家 电 类 商品 的 需求 不 会 因为 一 张 优 惠 券 就 突然 被 
激发 ， 冲 动 型 购买 的 特征 不 明显 。 表 来 分 析 x x 纸 巾 本 身 的 特点 : 价格 低 (30 元 以 内 ) 、 包 邮 (最 重要 的 因素 ， 相 当 于 直接 使 用 优惠 券 即 可 获得 免费 纸巾 ) 、 库 存 充 足 (保证 商品 可 以 购买 ) 、 大 众 消费 和 日 
常 使 用 (每 个 人 生活 中 都 可 以 用 到 ) 。 


通过 以 上 分 析 ， 数 据 部 门 得 出 的 结论 是 由 于 食品 百货 类 商品 中 的 x x 纸巾 订单 量 异常 增长 ， 导 致 该 楼 层 点 击 量 异 常 ， 问 题 的 根源 在 于 优惠 券 的 规则 设 定 以 及 商品 的 日 常 消费 特点 。 


回 到 关于 本 案例 位 置 点 击 率 分 布 的 话题 中 来 ， 通 过 数据 还 原 能 发 现 诸多 品类 中 例如 食品 百货 这 种 特殊 的 例子 和 事件 。 另 外 ， 很 多 品类 运营 时 都 可 能 会 把 销售 业绩 差 归 因 于 位 置 差 的 因素 ,但 实际 通过 数 
据 可 发 现 ， 位 置 对 于 商品 点 击 确实 会 有 影响 ， 但 影响 程度 远 没 有 想象 中 的 那么 高 。 例 如 位 置 第 二 屏 的 3C 数 码 和 位 于 第 三 层 的 厨 卫生 活 ， 单 从 位 置 来 看 用 户 点 击 量 基本 相同 。 换 句 话说 ， 如 果 是 运营 资源 不 具 
有 吸引 力 ， 即 使 放 到 首 屏 也 无 法 达到 理想 的 销售 效果 。 


2) 流量 引导 及 二 次 分 配 。 


在 这 一 部 分 ， 我 们 重点 分 析 页 面 间 的 导 流 关系 。 活 动 主页 面 流 量 引 导 图 ， 如 图 11-31 所 示 。 
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图 11-31 活动 主页 面 流 量 引 寻 图 


以 下 是 针对 流量 引导 和 分 配 的 基本 说 明 : 


' 流量 来 源 新 增 媒 介 L 和 媒介 N 和 导致 站 外 流量 总 量 及 占 比 提升 。 
` 站 外 推广 : 活动 页 面 主 要 流量 来 源 于 外 部 渠道 引入 〈84%) ， 较 上 月 上 升 20 个 百分点 ， 主 要 来 源 是 硬 广 〈84%) 、BD 时 航 (7%) ， 重 点 渠道 是 媒介 L (23.1%) 、 媒 介 N (7.6%) 。 
' 站 内 运营 : 从 主页 进来 的 流量 占 6%， 比 例 较 上 月 同期 下 降 5 个 百分点 。 


' 流量 走向 除 退 出 外 ， 大 部 分 〈 下 一 步 点 击 数据 中 占 比 88%) 用 户 点 击 主 分 会 场 相关 区 域 : 进入 主 活动 页 面 后 ，63% 直 接 选 择 退 出 ， 较 上 月 上 升 了 16 个 百分点 ， 访 问 最 多 的 分 会 场 是 手机 数码 ， 其 次 


是 电脑 、 家 居家 装 、 彩 电 、 冰 洗 空调 分 会 场 。 


综合 以 上 数据 ， 发 现 主 会 场 对 于 分 会 场 引流 不 明显 的 原因 在 于 两 方面 : 
一 是 进入 活动 页 后 直接 退出 的 用 户 比 例 上 升 ， 导 致 页 面 有 效 点 击 比例 下 降 ; 而 导致 退出 比例 上 升 的 原因 是 本 次 活动 新 增 的 媒介 L 和 媒介 N， 退 出 率 高 达 89%。 


“ 三 是 此 次 站 内 主页 面 对 分 会 场 引流 的 入 口 较 少 ， 仅 集中 在 每 层 区 域 的 第 一 个 位 置 ， 且 广告 设计 缺乏 亮点 和 吸引 力 ; 楼 层 中 的 大 部 分 位 置 都 是 打 爆 款 ， 导 致 大 多 数 用 户 在 楼 层 区 的 点 击 集中 在 爆 款 商 


3) 活动 当天 核心 活动 效果 分 析 、 活 动 节奏 和 促销 分 析 。 
在 该 部 分 内 容 中 ， 重 点 分 析 活 动 自身 的 重要 促销 要 素 以 及 关键 环节 ， 例 如 本 案例 中 的 抢购 是 带动 活动 气氛 和 活动 节奏 的 关键 。 


关于 活动 整体 节奏 : 活动 从 11 月 15 日 开始 预 热 ，11 月 16 日 就 已 经 有 会 场 活动 上 线 ， 到 11 月 18 日 开始 正式 活动 ， 整 个 流量 中 较为 稳定 的 直接 流量 、SEO 流 量 、CPS 流 量 和 EDM 流 量 回访 占 比 和 回访 频率 


较 低 ， 站 外 广告 投放 上 线 经 过 测试 和 正式 引流 ， 时 间 也 只 有 一 两 天 ， 对 用 户 的 覆盖 和 曝光 效果 没有 达到 | 稳定 效果 ， 预 热 期 和 宣传 期 较 短 导致 活动 开展 过 于 仓促 。 
关于 当天 的 抢购 : 抢购 第 一 波 从 凌晨 0 点 开始 ， 凌 晨 2 点 结束 ， 但 分 析 抢购 用 户 的 基本 特征 可 发 现 这 些 用 户 仅 购 买 了 抢购 商品 ， 对 其 他 商品 只 起 基本 的 连带 提升 作用 ; 且 用 户主 要 来 源 于 CPS 等 返利 型 网 


站 ， 具 有 较 强 的 目的 性 和 返 佣 性 质 。 从 这 些 用 户 的 回访 属性 看 ，80% 以 上 的 客户 活动 开始 期 间 内 平均 访问 深度 超过 30， 这 些 用 户 都 不 属于 普通 用 户 。 因 此 ， 第 一 波 的 活动 没有 达到 预期 的 开门 红 的 效果 ， 更 
没有 吸引 太 多 的 普通 用 户 参 与 到 此 次 活动 中 来 。 


活动 让 用 户 了 解 更 多 的 商品 信息 ， 从 而 拉动 其 他 商品 的 销售 。 


(4) 第 四 部 分 : 活动 商品 分 析 。 


活动 商品 分 析 阶 段 ， 会 重点 关注 以 下 几 个 方面 : 
“ 各 个 品类 的 目标 销售 任务 与 达成 情况 ， 衡 量 指标 通常 包括 目标 销售 额 、 实 际 销售 额 、 达 成 率 、 毛 利 、 毛 利率 、 达 成 率 、 妥 投 量 、 废 单 率 等 ;) 衡量 维度 通常 包括 商品 运营 的 中 心 级 别 、 一 级 类 目 、 二 级 
类 目 等 。 
. 各 个 品类 商品 销售 漏斗 ， 漏 斗 从 商品 总 SKU 数 开始 ， 依 次 包括 库存 SKU 数 、 可 售卖 SKU 数 、 上 架 SKU 数 、 有 浏览 SKU 数 、 有 售卖 SKU 数 ， 通 过 这 些 指标 可 以 进一步 得 到 售卖 率 、 动 销 率 等 指标 ， 以 便 评 
估 商 品 在 各 个 环节 的 流通 情况 。 
.对 于 参加 活动 商品 的 基本 分 析 ， 衡 量 指标 包括 UV、PV、 订 单 量 、 销 售 量 、 销 售 额 、 毛 利 、 毛 利率 、 妥 投 率 等 ， 在 评估 过 程 中 应 重点 关注 商品 售卖 结果 是 好 还 是 不 好 ， 以 及 影响 其 售卖 结果 的 原因 ( 流 
量 因 素 还 是 商品 促销 策略 因素 ) 。 
(5) 第 五 部 分 : 竞争 对 手 分 析 。 
竞争 对 手 分 析 通 常 只 针对 大 型 活动 ， 例 如 双 11、618 等 所 有 电 商 都 会 参与 大 事件 进行 。 竞 争 对 手 分 析 主 要 包括 以 下 几 个 维度 。 


1) 竞争 对 手 的 核心 卖点 。 图 11-32 是 主要 电 商 在 某 次 促销 活动 中 的 卖点 ， 通 过 这 些 卖点 ， 可 以 获得 一 些 重要 信息 。 例 如 有 的 企业 突出 吃 (品类 特点 ) 和 手机 (售卖 平台 ) ， 有 的 企业 突出 内 电 送 (物流 
送 ) 、 有 的 企业 突出 全 年 (时间 周期 ) 等 。 


天 不信 都 别 吵 “人 ”都 和 革 


时 说 了 有 屠 在 棕 见 站 . 
“埠头 在 部 是” 口水 例 ， 没 意思 要 搞 促 销 就 促 全 年 
平生 全 的 战 面 , 网 在 重 画 是 了 1 阿 宅 也 能 吃 遍 天 下 LL 体 基 生息 7 没门 贵 就 赔 a ti 


没关系 , 我 等 你 | “1 号 店 手机 不 断 失 a \ 
raanen.anroms7 上 上 价 2 ”让 玩 假 拌 ， 没 意思 ! ty 


村 好 娘 丰 没 关 夭 ， 还 有 呢 ! 比 不 伯 ， 不 怕 比 ， 怕 不 比 ! 不 起算 于， 退出 价格 战 ? 做 梦 | 
1 柚 很 忙 ， 大 过 节 出 阁 内] 电 送 
严肃 点 ， 这 几 办 美学 儿 阳 1 | G6.d 图 书 第 一 枪 ! 区 
PN /早点 是, 明天 见 ! 它 就 在 那里 对 了 ,六 月 
: 不 信和 ?来 下 对 不 天 No 易 迅 全 场 商 品 
六 月 fo or Nd = 价格 举报 有 妆 
a be 一如既往. i - Pld 虑 ， 近 寺 人 小 ! 


机 ily 


suningcom 
本 下 面 大 


56 月, 通 课 / :Jangdong.con 名 门生 EE 


图 11-32 主要 电 商 的 促销 活动 卖点 
2) 竞争 对 手 的 营销 推广 渠道 。 通 过 收集 竞争 对 手 的 关键 性 投放 数据 ， 可 以 获得 竞争 对 手 的 站 外 投放 策略 、 广 告诉 求 卖点 、 核 心 优势 等 。 例 如 ， 以 下 是 针对 某 竞 争 对 手 的 广告 分 析 中 的 部 分 内 容 
:门户 广告 策略 : 门户 首页 大 尺寸 、 大 曝光 资源 ， 配 合 高 流量 频道 大 尺寸 ， 高 曝光 点 位 ; 内 页 重要 点 位 ， 同 时 配合 其 在 门户 网 站 的 包 断 资源 ， 进 行 全 网 和 覆盖 ， 全 面 曝光 。 
. 视频 投放 策略 : 主流 视频 网 站 进行 全 面 投放 ， 重 点 大 曝光 位 ， 中 通 、 视 频 贴 片 等 高 流量 点 位 ， 进 行 活动 广告 展示 ,吸引 用 户 点 击 。 
* 客户 端 策略 : 搜狗 新 词 客户 端 ， 获 取 优 质 流量 ， 高 效果 的 媒体 。 


除了 媒体 投放 相关 分 析 外 ， 还 包括 公关 和 新 媒体 传播 相关 事件 ， 以 下 是 某 电 商 间 的 传播 事件 ， 如 图 11-33 所 示 。 


镍 不 说 你 了 呢 


真正 的 新 商业 文明 ， 

趟 是 噶 里 喊 荐 “让 天 下 没有 难 做 的 生意 ” ， 
而 实际 让 商家 “二 选 一 ” 难 做 生意 ; 
不 是 各 上 练 术 极 ， 而 桌 下 玩 掌 击 ; 

不 是 说 一 套 , 懒 一 套 . 


亲 ， 拜托 你 : 


大 加 TMALLCO 1、 不 要 再 各 商家 站 队 了 。 被 通 “ 二 选 一 ”的 商家 们 真 的 


很 使 好 ,也 很 无 亲 ; 卖家 们 已 经 党 尽 了 尘 断 的 昔 果 ; 如 果 


真正 的 回馈 消费 者 ， 不 是 以 各 种 促销 的 名 你 坚持 让 商家 活 在 息 惧 之 中 ， 迟 早 有 一 天 ， 你 也 会 ， 
义 ， 自 娱 自 乐 的 文案 秀 ， 不 是 花 钱 候 古 广告 
用 投资 人 、 商 家 的 钱 打 造 三 告 主 的 妖 穴 ， 也 不 2、 不 要 再 剥 剖 中 小 商家 了 。 他 们 已 经 把 你 们 暂时 推 到 了 


侈 白银 的 让 消费 者 得 利 ， 让 商家 成 长 ， 让 环 填 


更 健 库 诚信 。 拜 托 你 : | 
3、 不 要 再 欲 盖 浆 彰 了 。 我 们 只 挣 血汗 镜 ， 自 己 流血 流 汗 


1、 不 要 再 消费 消费 者 了 ， 消 费 者 的 每 次 期 待 干净 挣 钱 ， 永 二 谋求 暴利 ， 
部 是 一 次 信任 ， 潮 费 消 费 者 就 是 消费 信任 。 

你 来 ,或 者 不 来 ， 网 购 狂 欢 都 在 这 里 ， 你 息 ， 或 者 玄 ， 
真正 简单 、 快 乐 的 购物 体验 都 企 这 里 ， 你 可 以 选择 ， 和 消 
细 者 在 一 起 , 还 是 和 自己 的 怨念 在 一 起 ， 


2、 不 要 再 让 商家 流血 了 。 如 果 商 家 壕 了 , 谁 再 
来 提供 物美 价 廉 的 商品 。 


3、 二 要 再 自 扩 佑 人 了 。， 别 让 6,18 再 变 成 


8.15， 毕 竟 这 不 是 做 一 天 的 生意 ， 好 好 活着 
op , 示 灰 


南天 右 ebocormijinddondgofiicial 


图 11-33 ” 茶 电 商 间 的 传播 事件 


四 注意 在 分 析 公 关 事 件 时 不 仅 要 分 析 事 件 本 身 在 诉求 什么 ， 更 重要 的 是 分 析 这 些 事件 对 消费 者 、 商 品 、 其 他 电 商 的 相关 性 影响 。 例 如 ， 大 型 电 商 之 间 在 博弈 时 ,很 可 能 菜 个 成 功 事件 吸引 了 公众 眼 
球 ， 导 致 其 流量 大 涨 的 情况 。 


3) 竞争 对 手 活动 分 析 。 在 竞争 对 手 活动 分 析 中 ， 重 点 分 析 其 活动 的 节奏 、 组 成 、 关 键 促销 手法 。 以 某 电 商 为 例 ， 图 11-34 所 示 为 其 整个 6 月 的 活动 表 。 


图 11-34 某 电 商 6 月 活动 表 
通过 图 11-34 可 以 发 现 以 下 信息 : 
整个 活动 是 从 开门 红 ( 这 是 一 个 预 热 活动 ) 开始 ， 依 次 经 过 3C、 个 护 化 妆 、 大 家 电 、 老 刘 专 场 、 名 品 折 扣 、 商 超 食 品 和 图 书 音像 ， 其 中 在 6 月 17 日 ~6 月 19 日 的 老 刘 专场 是 重点 活动 。 
整个 活动 虽然 持续 1 个 月 ， 但 通过 不 同 的 子 品 类 活动 串联 ， 每 个 活动 大 约 持 续 3 天 ， 其 中 的 大 家 电 (家 电 、 手 机 和 家 居 ) 持续 时 间 较 长 为 6 天 。 


* 活动 期 间 的 前 半 段 都 是 用 户 关 注 度 较 高 的 品类 ， 也 是 其 网 站 的 核心 品类 ; 后 半 段 集中 了 次 要 品类 或 新 品类 ， 这 些 是 该 网 站 的 POP 平台 商品 。 


“ 其 中 一 条 隐藏 的 线索 是 ， 除 了 图 中 的 活动 主线 外 ， 还 有 各 品类 活动 穿插 ， 如 图 书 、 个 护 、 家 具 等 品类 的 满 减 活动 多 次 分 散 出 现 。 
通过 了 解 竞 争 对 手 的 活动 信息 对 我 们 有 什么 意义 ? 至 少 可 以 从 两 个 层面 有 所 启发 : 
“ 数据 结果 反馈 。 如 果 竞 争 对 手 在 某 个 时 间 段 的 主打 活动 品类 和 诉求 点 与 我 们 一 致 ， 那 么 必然 会 面临 分 流 的 问题 。 因 此 ， 如 果 网 站 平台 号 召 力 和 产品 优势 不 明显 ， 将 很 难产 生理 想 的 促销 结果 。 
. 活动 策划 的 优化 。 通 过 对 竞争 对 手 上 述 策 略 的 分 析 ， 结 合 本 企业 的 实际 情况 发 现 其 值得 学 习 和 优化 的 关键 点 ， 以 提升 自身 策划 和 运营 能 力 。 
4) 竞争 对 手 促销 分 析 。 表 11-10 是 某 电 商 优惠 券 数据 ， 通 过 这 些 数 据 可 以 发 现 如 下 问题 : 
` 优惠 券 的 主打 促销 类 型 是 满 减 和 满 返 。 
. 用 券 时 间 和 领 券 时 间 具 有 一 定 的 时 间 间 隔 ， 会 间接 促使 用 户 重复 访问 。 
“ 部 分 优惠 券 具 有 使 用 规则 ， 其 中 重点 是 满 减 与 满 返 的 县 加 使 用 ， 这 种 组 合 促 销 的 实际 应 用 价值 会 非常 高 。 
` 不 同 品类 的 满 减 或 满 返 策略 不 同 ， 同 时 一 个 品类 内 部 也 有 不 同 的 档次 差别 。 
表 11-10 ” 某 电 商 优 惠 券 数据 
活动 内 容 备 。 注 
全 扔 类 东 狼 ,最 做 满 200 元 减 10 无 ， 
最 噩 满 5000 元 减 200 元 
满 200 元 赚 618 无 10 位 数 纺 个 全 醒 类 


x + ht 
| nn 东 证 


6 月 01 日 ~ 6 月 03 日 | 需要 分 享 才 能 使 用 


6 月 10 日 ~6 月 16 日 


面 面 曾 曾 曾 各 


箱包 请 399 元 减 100 元 优惠 券 6 月 10 日 ~ 6 月 13 日 | 
家 用 电 需 满 3000 元 减 200 元 优惠 券 ” 16 月 10 日 ~ 6 月 13 日 [ 可 本 消减 登 加 


分 析 这 些 优惠 券 的 数据 以 及 满 减 、 满 返 ， 是 非常 实际 的 落地 点 。 例 如 ， 通 常情 况 下 各 个 网 站 的 比价 都 是 针对 网 站 正常 显示 的 售 价 或 促销 价 ， 但 是 用 户 最 终 成 交 价 很 可 能 与 促销 价 不 同 ， 通 常会 通过 满 
减 、 满 返 、 组 合 购买 等 能 便宜 很 多 。 假 如 某 商品 在 自己 网 站 卖 1999 元 ， 在 竞争 对 手 网 站 卖 2099 元 ， 表 面 上 来 看 竞争 对 手 价格 高 ; 但 竞争 对 手 实行 满 2000 元 减 200 元 的 策略 后 ， 使 得 折算 后 的 价格 其 实 是 
1899 元 。 因 此 ， 商 品 价格 是 否 足够 低 并 不 是 看 上 去 的 那么 简单 ， 需 要 经 过 各 种 运算 才能 得 出 。 


ia 竞争 对 手 分 析 更 多 的 偏 宏 观 市 场 分 析 ， 要 求 数据 分 析 师 具 有 一 定 的 宏观 视野 ， 能 有 效 将 宏观 市 场 分 析 和 微观 数据 分 析 结合 起 来 是 一 种 高 层次 境界 。 


5. 沟 通 落 地 
经 过 以 上 分 析 ， 我 们 获得 了 有 关 该 活动 的 整体 、 局 部 、 站 内 和 站 外 的 完整 信息 。 接 下 来 就 是 将 数据 结果 与 业务 部 门 进行 沟通 ， 沟 通过 程 中 需要 注意 以 下 几 点 : 


第 一 ， 将 完整 的 报告 拆 分 成 各 有 侧重 点 的 局 部 报告 。 由 于 此 类 活动 分 析 报 告 的 涉及 面 广 ， 完 整 报告 可 能 高 达 100 页 甚至 更 多 ， 数 据 分 析 和 报告 撰写 通常 费时 、 费 力 ， 且 由 于 生产 周期 长 、 缺 乏 针对 性 ， 
最 终 产 出 的 用 户 理解 、 用 户 应 用 结果 可 能 较 差 。 将 完整 的 报告 拆 分 成 各 有 侧重 点 的 局 部 报告 ,或 者 只 针对 核心 模块 、 新 增 模块 进行 重点 分 析 更 利于 提高 活动 分 析 的 针对 性 和 落地 效果 。 


第 二 ， 数 据 往往 贯穿 于 整个 大 型 活动 周期 。 从 数据 需求 的 确定 、 数 据 监测 实施 、 数 据 同步 采集 和 后 期 数据 分 析 挖 掘 。 报 告 是 从 活动 开始 之 前 就 已 经 在 准备 了 ， 尤 其 是 很 多 时 效 性 的 数据 如 热力 图 、 当 期 
活动 资料 需要 实时 收集 。 


第 三 ， 报 告 要 有 落地 点 。 无 论 汇 报 或 沟通 对 象 是 谁 ， 最 终 一 定 有 几 个 关键 且 集 中 的 落地 点 ， 即 报告 是 用 来 总 结 得 失 、 引 起 启发 或 解决 问题 的 。 这 些 落 地 点 可 能 会 包括 部 门 间 协 作 、 活 动 整体 策划 、 活 动 
排 期 等 宏观 建议 ， 也 可 能 是 广告 位 优化 、 商 品 坑 位 提升 等 微观 建议 。 


第 四 ,一 份 报告 是 一 次 终点 ， 也 是 一 次 起 点 。 没 有 任何 一 份 报 告 可 以 解决 所 有 问题 ， 因 此 很 多 结论 或 观点 都 可 以 作为 下 一 步 数 据 专 项 工作 的 线索 。 另 外 ， 一 次 报告 结论 也 可 能 存在 偶然 性 因素 ， 将 多 个 
类 似 的 主体 进行 演绎 归纳 ， 会 得 到 更 科学 、 更 全 面 的 结论 。 


11.4.4 商品 销售 诊断 


1. 专 题 背景 


单 品 运 曹 或 爆 款 运营 是 电子 商务 的 重要 环节 ， 针 对 商品 的 销售 诊断 同样 必 不 可 少 。 本 案例 将 围绕 商品 销售 诊断 展开 分 析 。 
2. 前 期 沟通 


该 需求 是 业务 部 门 提出 的 针对 A、B、C 单 品 策略 实施 效果 的 分 析 需 求 ， 核 心 是 找到 产品 P 的 销售 短 板 ， 并 找到 弥补 短 板 的 提升 策略 。 

Os A、B、C 单 品 策略 是 企业 内 部 挑选 出 的 具有 一 定 优 势 的 单 品 资源 。 例 如 包销 、 定 制 、 提 前 供 货 等 ， 并 将 单 品 最 终 评级 分 为 三 个 级 别 ， 按 照 从 高 到 低 依次 是 A、B、C。 
从 运营 部 门 的 需求 突出 两 点 : 

第 一 ， 运 营 的 核心 是 提升 销量 ; 

第 二 ， 找 到 关键 短 板 并 能 进行 改善 。 

3. 数 据 准 备 

在 做 商品 分 析 之 前 ， 数 据 部 门 需 要 有 以 下 几 类 数据 : 

. 商品 站 外 投放 数据 ， 包 括 商 品 投放 的 渠道 、 排 期 、 素 材 卖 点 、 着 陆 页 等 ; 


商品 站 内 资源 位 支持 数据 ， 包 括 站 内 资源 位 位 置 、 排 期 等 ; 


. 商品 库存 数据 ， 包 括 每 日 的 商品 库存 量 ; 

“ 商品 数据 ， 包 括 商品 属性 、 参 数 、 价 格 、 折 扣 、 促 销 折扣 等 ; 

. 用 户 数 据 ， 用 户 基 本 属性 、 行 为 、 购 买 等 数据 ; 

订单 数据 ， 订 单 商 品 、 子 订单 、 优 惠 券 等 数据 ; 

.竞争 对 手数 据 ， 包 括 竞争 对 手 商 品 促销 、 价 格 、 库 存 、 售 卖 量 等 。 

4. 初 步 结论 

(1) 整体 汇总 

第 一 步 是 进行 数据 汇总 ， 整 体 观 测 数据 统计 区 间 内 的 商品 销售 情况 。 从 表 11-11 所 示 的 数据 来 看 ， 整 体 销售 日 均 目 标 销量 为 18349， 实 际 销量 仅 为 12336， 完 成 率 仅 为 67%， 处 于 偏 低 的 水 平 。 
Oi 完成 率 偏 低 的 结论 是 和 其 他 A、B、C 单 品 销售 完成 度数 据 进 行 对 比 得 出 的 。 


表 11-11 产品 P 上 日 均 销量 与 达成 结果 数据 对 比 表 


维 度 目标 销量 实际 销量 完 成 率 


在 分 析 完 成 率 偏 低 的 原因 时 ， 首 先 想 到 的 是 是 否 存在 某 天 的 完成 度 特别 差 而 拉 低 了 整个 数据 水 平 。 因 此 ， 按 日 对 当月 的 目标 销量 和 实际 销量 进行 分 析 ， 结 果 如 图 11-35 所 示 ， 产 品 P 在 分 解 到 每 日 的 销售 
计划 中 也 都 没有 完成 ， 其 完成 率 波动 范围 在 41%~899%6， 这 意味 着 不 存在 个 案 影 响 导 致 的 完成 率 偏 低 。 


既然 不 是 个 案 影 响 ， 那 么 我 们 从 引流 分 析 、 转 化 漏斗 分 析 和 竞争 对 手 分 析 三 个 维度 进行 分 析 ， 了 解 到 底 是 哪些 全 局 性 因素 导致 了 销售 效果 不 理想 。 
(2) 引流 分 析 


与 站 内 促销 分 析 类 似 的 是 ， 商 品 要 想 完 成 一 定 规模 的 售卖 ， 必 须 有 相当 的 流量 支持 才能 完成 。 因 此 本 阶段 分 析 站 内 、 外 资源 对 该 商品 的 引流 支持 。 


首先 分 析 站 外 引流 ， 从 网 站 分 析 工 具 中 的 进入 页 面 (着 陆 页 ) 报表 ， 下 钻 站 外 来 源 渠 道 ， 可 得 到 该 产品 页 的 站 外 直接 进入 流量 来 源 。 


目标 销量 、 实 际 销量 情况 


上 目标 销量 上 实际 销量 


图 11-35 ”产品 P 目 标 销量 与 实际 销量 情况 


@iae 示 如 果 从 页 面 报表 或 产品 报表 下 外 到 站 外 来 源 渠 道 ， 得 到 的 数据 是 该 产品 的 流量 来 源 于 哪些 渠道 ， 数 据 结果 包含 两 部 分 来 源 : 一 是 以 该 页 面 作为 着 陆 页 直接 进入 渠道 ， 即 用 户 从 站 外 第 一 个 到 达 
的 网 站 页 面 就 是 这 个 页 面 ; 二 是 从 站 外 来 源 渠 道 进入 网 站 〈 着 陆 页 非 该 页 面 ) 后 ， 通 过 站 内 页 面 链 接 进 入 该 页 面 。 本 案例 中 站 外 引流 的 需求 只 需 过 滤 从 站 外 渠道 直接 进入 产品 P 页 面 的 渠道 ， 因 此 不 能 使 用 该 


方法 实现 。 
经 过 整理 后 的 数据 ， 如 表 11-12 所 示 。 


表 11-12 ”站 外 引流 日 均 数 据 汇 总 表 


i 销售 
来 源 渠 诞 UV 
ee ww eh 


3.00 


疝 品 汇总 411 291 


由 表 11-12 提 供 的 数据 可 发 现 ， 站 外 推广 资源 带 来 的 UV 合计 占 比 为 48%， 但 带 来 的 销量 占 比 仅 为 44%， 主 要 问题 在 于 转化 率 低 。 通 过 细 分 不 同 媒介 的 效果 ， 发 现 两 个 异常 值 : 一 是 媒介 C 销 售 转化 率 
达 5.6%; 二 是 媒介 D 销 售 转化 率 低 至 0.289%。 


根据 分 析 可 知 ， 媒 介 C 属 于 CPS 类 渠道 ， 即 用 户 通过 该 渠道 下 单 后 可 直接 获得 返 佣 ( 返 现 ) ， 这 类 渠道 的 用 户 目标 性 强 ; 而 媒介 D 只 有 一 个 来 源 位 置 ， 该 位 置 进入 面 之 后 的 跳出 率 高 达 89%， 新 
访客 占 比 为 92%， 页 面 停留 时 间 仪 为 6 秒 。 这 些 数据 说 明了 在 跳出 页 的 表现 极 差 ， 渠道 或 页 面 可 能 存在 某 些 问 题 。 以 下 为 该 渠道 的 基本 投放 情况 。 


. 投放 时 间 : 8 月 1 日 ~8 月 7 日 。 
` 投放 渠道 : 某 客户 端 广告 。 


* 投放 内 容 : 以 低 价 为 主要 卖点 ， 广 告 素材 内 容 如 图 11-36 所 示 。 
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图 11-36 ”媒介 D 客 户 端 广告 


单纯 从 该 广告 本 身 来 看 不 存在 明显 问题 ， 但 点 击 测试 并 跟 业 务 部 门 沟通 ， 发 现 以 下 两 个 关键 信息 点 。 


第 一 ， 信 息 不 一 致 问题 。 点 击 广告 之 后 的 产品 页 面 ， 如 图 11-37 所 示 。 


细心 的 读者 已 经 发 现 : 站 外 广告 标价 299 元 ， 但 产品 页 标价 309 元 ， 价 格 不 一 致 会 让 用 户 产 生 被 欺骗 的 感觉 。 经 过 与 业务 部 门 的 沟通 得 知 ， 如 果 用 户 领取 并 应 用 满 300 元 减 10 元 的 优惠 券 ， 那 么 最 终 成 交 
格 确 实 是 299 元 。 但 是 ， 这 个 信息 没有 明确 告知 消费 者 ， 从 而 导致 信息 传递 有 误差 。 因 此 ， 可 以 考虑 在 产品 描述 中 加 入 一 句 “ 进 入 * 页 面 领 券 10 元 优惠 券 ， 即 可 享受 最 低 299 元 ”或 通过 其 他 方式 告知 如 何 


价 
享受 最 低 价 。 


[团购 限量 轩 让 9] Eee 微波 炉 MM721NG2-PW1 机 械 版 21L ， 


¥309.00 降价 十 知 
商品 评价 : 好 评 度 95% 612 人 评价 〖 缚 行 线 襄 服 
北京 市 东城 区 全 部 区 域 " 有 货 
令 日 20:00 前 完成 下 单 ， 客 计 图 日 (08 月 09 日 ) 送 达 
由 配送 并 提供 保障 监管 。 支 持 : 国 类 到 付 堵 国 免 运 更 贺 自 提 


购买 数量 : + 


证 保 服务 : | 图 延长 保修 1 年 ¥8 元 | 什么 是 


图 11-37 ”商品 页 关键 信息 
第 二 ， 新 资源 的 效果 沉淀 问题 。 媒 介 D 为 新 增资 源 ， 想 达到 稳定 的 投放 效果 需要 更 多 的 测试 和 磨合 ， 客 观 上 也 存在 新 用 户 比 例 较 高 、 对 网 站 认可 度 较 低 的 问题 。 


其 次 是 站 内 引流 ， 站 内 引流 有 两 种 处 理 方法 : 方法 一 是 只 看 其 他 页 面 对 产品 P 页 面 导 流 的 数量 ; 方法 二 是 不 仅 看 导 流 的 数量 ， 还 看 导 流 的 质量 ， 即 产生 的 订单 转化 情况 。 为 了 方便 读者 理解 ， 我 们 分 别 介 
绍 这 两 种 方法 。 


方法 一 : 通过 页 面 路 径 看 产品 P 页 面 的 来 源 。 这 种 方法 只 能 看 到 页 面 级 别 的 导 流 数据 ， 如 果 同 一 个 页 面 存在 多 个 资源 位 则 无 法 区 分 ; 另外 ， 该 报表 只 能 提供 基于 流量 的 引流 ， 即 从 PV 的 角度 来 分 析 不 同 
页 面 或 来 源 给 产品 P 带 来 的 PV 量 ， 其 他 角度 无 法 提供 。 该 数据 从 网 站 分 析 工 具 的 路 径 报 表 即 可 获得 ， 关 于 流量 路 径 的 报表 本 书 在 之 前 很 多 章节 都 有 提 到 ， 在 此 不 作 袭 述 。 


方法 二 : 通过 自 定义 监测 代码 获得 具体 的 位 置信 息 。 通 过 自 定义 参数 跟踪 ， 可 将 站 内 运营 资源 位 作为 内 部 推广 渠道 进行 跟踪 ， 以 下 是 某 工具 对 站 内 广告 位 的 跟踪 : 


www .example.com? intad=sy-C-1-1-1-app 


其 中 ，sy-C-1-1-1-app 参 数 代表 了 站 内 资源 位 的 页 面 、 资 源 位 ID、 品 类 特征 、 活 动 特征 等 。 通 过 整理 内 部 参数 数据 ， 得 到 表 11-13 的 结果 。 


表 11-13 站 内 资源 位 引流 日 均 数 据 


二 
占 比 /% \ 转化 率 /% 
站 页 位 置 1 2 77 
全 页 们 置 2 Ge 


3 


从 站 内 引流 数据 分 布 来 看 ， 整 体 转化 率 差异 较 小 : 商品 P 所 在 的 超市 页 1 由 于 人 群 更 加 精准 而 转化 率 较 高 ， 首 页 位 置 1 虽然 流量 较 大 但 转化 率 一 般 。 站 内 引流 暂时 没有 明显 短 板 。 
从 目标 实现 的 具体 情况 来 看 ， 在 保持 转化 率 不 变 的 前 期 下 ， 要 达成 目标 需要 提升 流量 规模 。 测 算 流量 规模 有 两 种 方法 。 
第 一 种 方法 是 较为 基本 的 均值 算法 。 要 实现 日 均 18349 的 销量 ， 按 照 目前 3% 的 转化 率 测算 需 要 UV 日 均 611644， 计 算 公 式 为 如 下 。 


目标 UV = 18 349 / 0.03% = 611 633 


第 二 种 方法 是 通过 模型 拟 合 出 UV 与 销量 的 天 系 ， 进 而 计算 出 目标 UV。 以 Excel 2013 为 例 介绍 这 种 方法 。 
步骤 一 : 打开 附件 原始 数据 中 的 “商品 销售 诊断 ”， 选 中 其 中 实际 销量 和 实际 UV 两 列 。 


步骤 二 : 依次 选择 “插入 一 散 点 图 ”， 得 到 如 图 11-38 所 示 的 图 形 〈 可 稍 作 修饰 ， 将 其 中 的 水 平 网 格 线 和 垂直 网 格 线 删除 以 便 更 好 的 观察 数据 点 的 关系 ) 。 通 过 散 点 图 可 发 现实 际 销量 和 UV 间 大 体 呈 现 
线性 或 指数 型 分 布 。 


步骤 三 : 
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依次 选择 “添加 图 标 元 素 一 趋势 线 一 线性 
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， 效 果 如 图 11-39 所 示 。 


2.000 


图 11-38 ”数据 散 点 图 
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S90, B23. 
图 11-39 ” 拟 合 趋势 图 


步骤 四 : 选中 趋势 线 ， 右 击 选 择 设置 趋势 线 格式 ， 在 弹出 的 设置 窗口 中 勾 选 底部 显示 公式 和 显示 R 平 方 值 。 为 了 验证 线性 拟 合 是 否 是 最 佳 拟 合 ， 可 以 选择 其 他 趋势 线 ， 观 察 其 中 R 平 方 值 的 变化 。 从 R 平 
方 值 可 以 看 出 ， 当 拟 合 国 数 为 多 项 式 或 对 数 时 ， 拟 合 程度 较 高 (R 平 方 值 较 高 ) ， 这 里 选择 二 次 多 项 式 (多 项 式 设置 顺序 为 2) ， 效 果 如 图 11-40 所 示 。 得 到 以 下 拟 合 函 数 : 


y=-0.0018x2+75.512x-230199 


实际 UV 


y =-0.001 8x2+75512x - 230199 


4 .000 6b,000 8,.000 i0000 132000 14000 16,000 


图 11-40” 拟 合 趋 势 图 


完美 拟 合 。 通 过 这 个 模型 计算 出 的 结果 存在 误差 的 可 能 性 较 大 。 


二 示 本 案例 中 的 数据 由 于 是 拟 合 数 据 ， 因 此 在 拟 合 程度 较 高 的 二 项 式 和 对 数 模型 中 ，R2 仅 为 0.5 左 右 ， 拟 合 程 度 偏 中 等 ， 即 不 是 
际 工 作 中 的 R2 在 0.7 以 上 时 是 比较 好 的 拟 合 结果 。 
拟 合 函 数 已 经 确认 ， 现 在 的 问题 是 当 x (销量 ) 为 18349 时 ，y 应 该 是 多 少 ? 


= -0.001 8 x 18 3492 + 75.512 x 183 49 - 230 199 = 549 336 


这 个 值 相 比 使 用 均值 计算 的 方法 更 加 准确 ， 因 此 在 流量 规模 上 的 缺口 是 : 


了 


缺口 流量 = 549 336 - 411 291 = 138 130 
实现 。 这 些 额 外 流量 既 可 以 通过 增加 站 外 投放 渠道 获得 ， 也 可 以 增加 站 内 推荐 资源 位 。 


由 此 得 出 结果 ， 在 保持 转化 率 不 变 的 情况 下 ， 要 想 实 现 目 标 ， 日 均 额 外 需要 138130 UV 才能 


(3) 转化 漏斗 分 析 
从 提升 流量 的 角度 达成 目标 ， 另 外 一 个 思路 是 通过 提升 转化 率 达 成 目标 。 提 升 站 内 转化 效果 一 种 方法 是 找到 目前 转化 漏斗 中 的 关键 
结算 用 户 数 以 及 最 终 提 交 订 单 的 用 户 数 提取 出 来 ， 从 而 形成 转化 漏斗 ， 其 数据 如 表 11-14 所 示 。 


只 是 点 ， 通 过 弥补 短 板 来 提升 商品 销量 。 通 过 网 站 分 析 工 
具 可 以 将 到 达 产 品 页 的 用 户 数 、 加 入 购物 车 用 户 数 、 
表 11-14 站 内 商品 转化 漏斗 数据 


加 入 购物 本 转化 率 /% 结算 转化 率 /% 销售 转化 率 /% 


中 - 有 
可 


页 浏览 转化 率 ) 仅 为 33.3%， 大 部 分 用 户 在 这 个 环节 流失 ; 而 其 他 环 


从 表 11-14 的 数据 可 以 发 现 用 户 到 达 产 品 页 的 转化 率 为 24%， 但 到 达 购 物 车 的 转化 率 仅 为 8%， 相 对 转化 率 (加 入 购物 车 转化 率 / 产 


节 的 相对 转化 率 均 超过 了 60%。 
是 如 何 提升 用 户 看 过 产品 P 之 后 的 加 入 购物 车 的 目标 转化 率 
个 问题 对 于 新 品 和 爆 款 产 品 尤 为 重要 。 


因此 ， 现 在 的 天 键 问 题 。 有 以 下 几 个 维度 可 以 提升 用 户 加 入 购物 车 的 转化 效果 。 


库存 检查 过 库存 数据 分 析 是 否 存在 库存 不 足 导致 无 法 下 单 的 情 
p: 仓储 都 会 根据 流转 模式 将 库 区 分 为 却 货 区 、 库 存 区 、 退 货 区 、 滞 销 区 、 畅 销 区 等 ， 商 品 正 常 进入 仓库 之 后 可 
这 种 情况 在 企业 举办 大 型 促销 活动 ， 仓 储 进出 


人 @ 诗 示 即使 库存 充足 ， 很 多 时 候 也 会 出 现实 质 上 的 无 库存 而 导致 无 法 下 单 的 情况 。 例 如 
攻 并 未 直接 进入 库存 区 ， 而 是 首先 放 到 鼻 货 区 暂 存 ; 当 订 单产 生 后 ， 仓 储 人 员 在 分 拣 过 程 中 无 法 在 库存 区 找到 该 商品 (因为 商品 在 纯 货 区 ,而 不 是 库存 区 ) 。 


压力 大 时 出 现 的 可 能 性 很 大 。 


` 促销 策略 。 满 减 、 满 返 、 搭 配 销售 、 组 合 套装 等 都 是 常用 的 促销 方式 。 


* 产品 价格 。 比 竞争 对 手 低 的 产品 价格 更 容易 吸引 用 户 下 单 。 


“ 良好 的 用 户 评论 信息 。 较 多 的 正面 信息 更 容易 获得 用 户 的 信赖 。 
以 上 这 些 都 属于 感性 分 析 ， 即 依靠 业务 经 验 和 数据 经 验 得 到 的 结论 ;作为 数据 分 析 师 ， 通 过 数据 的 归纳 、 推 理 和 演绎 会 有 更 精准 的 方法 提升 加 入 购物 车 的 目标 转化 率 。 
` 通过 分 析 商 品 页 的 用 户 点 击 热 力图 发 现 用 户 的 关注 信息 。 例 如 通过 热力 图 可 能 会 发 现 用 户 对 于 商品 评价 、 快 捷 支 付 、 包 装配 送 的 点 击 率 或 点 击 热 度 较 高 ， 此 时 可 以 有 针对 性 地 在 站 内 外 广告 宣传 时 发 


握 该 产品 在 这 些 方 面 的 优势 并 对 用 户 进行 曝光 。 


. 通过 提升 用 户 的 精准 度 以 提高 转化 率 。 通 过 关联 模型 计算 出 购买 了 其 他 商品 还 会 购买 商品 P 的 规则 ， 然 后 将 购买 了 其 他 商品 但 没有 购买 商品 P 的 用 户 提炼 出 来 ， 精 准 推 送 广 告 如 EDM、 短 信 等 
数据 找 出 已 经 将 商品 加 入 购物 车 但 未 完成 购买 的 登录 用 户 ， 并 通过 邮件 或 短信 等 提示 其 继续 完成 购买 流程 ; 同时 ， 可 以 配合 限时 抢购 、 优 惠 券 使 用 期 限 等 促销 刺激 方式 挽回 用 户 。 


“ 在 商品 P 页 面 加 入 Rematketing 跟 踪 标 记 ， 并 设 定 当 用 户 浏览 过 此 商品 P 页 面 但 未 完成 购买 ， 在 站 外 做 定向 广告 推送 时 ， 有 针对 性 的 推荐 商品 P。 


(4) 竞争 对 手 分 析 

自身 数据 分 析 完 之 后 ， 接 下 来 是 做 竞争 对 手 分 析 ， 核 心 维度 是 产品 、 价 格 、 、 促 销 。 
. 产品 ; 竞争 对 手 在 推销 的 类 似 或 相同 的 产品 有 哪些 ， 具 有 哪些 优势 和 不 足 。 

. 价格 : 如 果 是 相同 的 商品 ， 价 格 差异 度 如 何 ， 更 低 的 价格 更 容易 被 用 户 认 可 。 


: 竞争 对 手 在 站 内 、 外 哪些 资源 和 渠道 进行 推广 。 


[ai 


` 促销 : 竞争 对 手 用 了 哪些 促销 策略 。 
人 证 示 细心 的 读者 已 经 发 现 ， 竞 争 对 手 分 析 的 四 点 是 4P 营 销 理论 ， 该 理论 对 于 商品 运营 人 员 的 实际 操作 具有 重要 的 指导 意义 
5. 沟 通 落 地 
经 过 以 上 分 析 已 经 得 出 了 结论 : 就 目前 流量 来 看 ， 站 外 渠道 (媒介 D) 仍 有 优化 空间 ;要 实现 预期 销售 目标 可 以 从 两 个 方面 入 手 。 
` 一 是 提升 商品 页 流量 ， 预 期 日 均 额 外 需要 138130 才 能 实现 。 

二 是 提升 转化 率 ， 重 点 优化 产品 页 到 加 入 购物 车 的 转化 率 ， 同 时 通过 人 和 群 精 准 定位 、 选 择 、 推 送 和 找 回 来 提升 转化 效果 。 


通常 来 说 ， 以 上 两 方面 需要 同时 沟通 并 推进 落地 ， 以 提高 目标 实现 的 可 能 性 。 


11.5 ”本 章 小 结 


本 章 阐述 了 如 何 通 过 数据 辅助 网 站 运营 辅助 决策 ， 重 要 知识 点 如 下 : 


. 三 种 常用 的 网 站 分 析 场 景 ， 重 点 是 整体 资源 价值 需 最 大 化 ; 


运营 辅助 决策 是 除 营 销 辅助 决策 之 外 ， 与 网 站 数据 分 析 结 合 最 紧密 的 部 分 。 由 于 运营 数据 分 析 具 有 非常 强 的 实践 性 特点 ， 希 望 读者 能 够 继续 完成 以 下 实践 内 容 : 


` 规划 网 站 运营 支持 的 专项 分 析 体系 ， 将 按照 项 目 制 分 解 到 每 周 逐步 实现 ; 
` 针对 企业 当前 运营 的 重点 和 难点 ， 参 考 本 章 中 的 案例 ， 动 手 撰写 一 篇 专项 分 析 报 告 。 
另外 ， 限 于 篇 幅 ， 本 章 的 很 多 知识 无 法 全 面 展开 ， 和 希望 读者 能 做 进一步 思考 和 深入 探讨 : 
. 如 何 使 用 附件 数据 针对 A2 广 告 位 建立 站 内 广告 位 的 效果 标杆 ; 
“ 在 做 用 户 调研 分 析 时 ， 如 何 将 更 多 的 CRM 维 度 与 调研 问卷 相 结合 来 挖 据 更 有 价值 的 知识 ; 


. 4P 和 4C 是 重要 的 营销 理论 ， 和 希望 读者 能 通过 其 他 资料 进行 更 深入 的 学 习 。 


第 12 章 ”数据 驱动 下 的 个 性 化 运 言 应 用 


关于 数据 驱动 的 落地 应 用 ， 在 本 书 的 第 10 章 已 经 详细 介绍 了 有 关 数 字 营 销 的 部 分 ， 本 章 将 进一步 介绍 数据 驱动 在 个 性 化 运营 中 的 应 用 。 


本 章 将 围绕 网 站 运营 的 有 关 概 念 ， 从 其 发 展 的 三 种 形态 入 手 展现 个 性 化 运营 的 价值 体现 、 核 心 应 用 以 及 落地 时 的 窘境 。 通 过 学 习 ， 读 者 能 够 对 站 内 个 性 化 运营 有 清晰 的 认识 和 辨证 的 思考 ， 同 时 能 够 掌 
握 结合 企业 实际 情况 有 步骤 、 有 计划 的 推动 数据 驱动 在 个 性 化 运营 中 落地 的 基本 能 力 、 步 又 和 方法 。 


12.1 ”网 站 运营 的 概念 和 汽 转 


网 站 运营 指 围绕 网 站 开展 的 ， 以 提升 品牌 曝光 、 用 户 体验 、 销 售 转 化 等 为 目的 的 业务 工作 ， 主 要 内 容 分 为 四 个 方面 。 

* 活动 管理 : 通过 策划 各 种 事件 、 活 动 、 主 题 内 容 等 形式 提升 品牌 曝光 度 、 用 户 活跃 度 及 笑 性 ， 同 时 带 来 可 观 的 销 信 或 转化 效果 。 
` 内 容 管 理 : 网 站 上 日常 内 容 维护 ， 包 括 新 闻 、 资 讯 、 广 告 等 的 编辑 、 更 新 、 发 布 、 删 除 等 

. 用 户 维护 : 围绕 用 户 展开 的 用 户 体验 优化 、 产 品 功 能 设计 、 用 户 关系 管理 等 业务 动作 。 

:在线 销售 : 围绕 商品 展开 的 商品 促销 、 商 品 销售 等 业务 动作 。 


除了 以 上 工作 外 ， 大 运营 的 概念 可 能 还 包括 站 外 竞争 分 析 、 新 盈利 模型 探索 、 网 站 技术 开发 和 设计 、 站 外 营销 推广 等 工作 ， 不 同 企业 对 网 站 运营 部 门 的 工作 范围 界定 有 所 差异 。 


12.2 网 站 运营 发 展 的 三 种 形 纺 \ 


网 站 运营 发 展 按照 运营 规则 来 看 ， 依 次 经 历 了 粗放 型 运营 、 群 组 运营 和 个 性 化 运营 三 种 形态 。 


(1) 基于 全 部 规则 的 粗放 型 运营 


基于 全 部 规则 的 粗放 型 运营 指 所 有 网 站 运营 工作 的 开展 都 是 以 企业 自身 为 核心 ， 将 相同 的 规则 应 用 到 企业 全 部 运营 范围 中 。 在 这 一 过 程 中 ， 企 业 处 于 优势 地 位 ， 用 户 只 能 被 动 接收 网 站 信息 而 缺乏 选择 
性 和 针对 性 。 


(2) 基于 细 分 规则 的 群 组 运营 


基于 细 分 规则 的 群 组 运营 已 经 开始 区 分 用 户 ， 并 根据 企业 自身 资源 运营 需求 在 不 同类 型 的 资源 中 运营 不 同 的 内 容 ; 或 者 根据 用 户 的 群 组 划分 ， 对 相同 群 组 的 用 户 展开 相同 的 运营 动作 。 在 这 个 过 程 中 ， 
用 户 具 有 在 一 定 范围 内 选择 内 容 的 权利 ， 但 内 容 仍 然 是 基于 群 组 规则 而 非 个 人 规则 。 


(3) 基于 个 人 推荐 的 个 性 化 运营 


基于 个 人 推荐 的 个 性 化 运营 是 在 综合 用 户 喜 好 、 企 业内 部 资源 特点 的 基础 上 ， 将 企业 资源 与 用 户 需求 完美 结合 ， 针 对 不 同 的 用 户 进行 精准 运营 的 过 程 。 个 性 化 运营 是 企业 与 个 人 信息 交互 的 过 程 ， 这 个 
过 程 中 不 存在 明显 的 主 从 关系 ,双方 互 为 信息 的 发 送 者 和 接受 者 。 


三 种 形态 的 运营 规则 ， 如 图 12-1 所 示 。 


基于 全 部 规则 的 粗放 型 过 各 基于 细 分 视 则 的 群 组 运 吉 基于 个 人 推 厦 的 个 性 化 运 吕 
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图 12-1 三 种 形态 的 运营 规则 
12.3 个 性 化 网 站 运营 的 价值 
个 性 化 网 站 运营 与 其 他 两 种 运营 方式 相 比 ， 其 价值 主要 体现 在 以 下 四 个 方面 。 
(1) 增加 长 尾 内 容 曝 光 
很 多 网 站 由 于 内 容 过 多 ， 很 多 优质 内 容 无 法 被 用 户 看 到 ， 因 此 呈现 出 网 站 内 容 流量 分 布 的 长 尾 特 点 。 站 内 个 性 化 网 站 运营 可 以 将 长 尾 内 容 与 用 户 个 性 化 需求 相 结 合 ， 使 长 尾 内 容 如 长 尾 关键 字 、 长 尾 商 
品 、 长 尾 资讯 等 ， 通 过 更 多 的 内 容 满足 不 同 用 户 需求 ; 并 且 个 性 化 规则 中 可 以 指定 人 工 干预 ， 通 过 固定 展示 规则 达到 长 尾 内 容 曝 光 的 目的 。 


(2) 提高 站 内 用 户 体验 


个 性 化 运营 的 本 质 是 将 运营 的 核心 从 企业 转移 到 用 户 ， 即 所 有 的 内 容 都 是 根据 用 户 需 求 和 喜好 而 产生 的 ; 在 这 一 过 程 中 ， 用 户 从 进入 落地 页 开始 整个 体验 度 上 升 ， 同 时 企业 也 将 从 中 受益 ， 表 现在 数据 
上 是 访问 深度 和 停留 时 间 的 增加 、 退 出 率 和 跳出 率 的 降低 以 及 最 终 转化 效果 的 提升 。 


(3) 提高 网 站 转化 率 


对 于 销售 型 网 站 而 言 ， 个 性 化 运营 通过 精准 的 内 容 匹 配 为 用 户 推荐 最 适合 或 最 喜欢 的 商品 ， 在 相同 的 流量 规模 和 流量 结构 下 必然 会 提升 网 站 的 转化 率 ， 这 也 是 个 性 化 运营 对 企业 最 重要 的 贡献 之 一 。 另 
外 ， 个 性 化 运营 还 能 通过 对 已 经 标识 的 流失 用 户 进行 精准 的 信息 推送 ， 从 而 达到 对 流失 订单 和 流失 用 户 的 挽回 。 


(4) 提高 订单 客 单价 和 销售 额 


除了 提高 转化 率 ， 个 性 化 运营 还 能 在 用 户 下 订单 的 过 程 中 ， 适 时 的 推荐 用 户 可 能 一 起 购买 或 组 合 购买 的 商品 套件 ， 直 接 增加 用 户 单 次 订单 的 商品 数量 、 客 单价 和 销售 额 ， 这 也 是 提升 销售 效果 的 重要 途 


@ia 示 通过 以 上 分 析 ， 读 者 可 能 会 认为 个 性 化 网 站 运营 是 一 把 万 能 钥匙 ， 但 实际 上 很 难 用 数据 精确 地 区 分 个 性 化 运营 所 带 来 的 实际 效果 ， 原 因 是 用 户 的 站 内 行为 受 多 种 因素 的 影响 ， 站 外 渠道 、 站 内 
产品 设计 、 网 站 基本 和 运营、 活动 策划 、 网 站 改版 等 都 可 能 影响 用 户 决 策 。 因 此 无 法 回答 “假如 去 掉 个 性 化 运营 ， 网 站 会 损失 多 少 ? ”也 正 是 因为 如 此 ， 个 性 化 运营 的 价值 很 难 放大 。 


12.4 个 性 化 网 站 运营 的 应 用 


个 性 化 网 站 运营 根据 应 用 平台 的 不 同 可 分 为 在 线 应 用 和 离线 应 用 两 部 分 
12.4.1 个 性 化 网 站 运营 的 在 线 应 用 


在 线 应 用 根据 用 户 在 网 站 上 的 行为 进行 实时 计算 ， 并 在 用 户 发 出 动作 指令 之 后 立即 反馈 个 性 化 系统 结果 。 在 线 应 用 的 部 分 通常 被 称 为 个 性 化 推荐 ， 主 要 形式 包括 以 下 四 种 。 
1. 根 据 用 户 浏览 数据 的 个 性 化 运营 
根据 用 户 浏览 数据 的 个 性 化 运营 主要 应 用 于 广告 、 商 品 、 资 讯 、 文 章 、 视 频 、 音 频 等 内 容 运营 和 管理 中 ， 主 要 方式 包括 : 看 了 还 看 、 看 了 最 终 购 买 、 其 他 用 户 在 看 等 。 


“ 看 了 还 看 。 根 据 用 户 当前 浏览 内 容 推 荐 下 一 个 最 可 能 感 兴趣 的 内 容 ， 通 常 在 商品 或 内 容 详 细 页 的 两 侧 或 底部 出 现 ， 主 要 作用 是 引导 用 户 的 浏览 行为 。 图 12-2 所 示 为 针对 用 户 浏览 之 后 的 推荐 信息 。 


调 抽 此 商品 的 原 宕 也 同时 调 艳 


Panasonit 栓 下 TH-= Panasonic/ 松 下 TH- BenQ 明基 EW738D 住 商 两 Panasonie/ 栏 下 TH= 
48AS650C #48 英寸 液晶 电视 42aAdD0clPSLED 真 旺 申 视 用 投影 机 (黑色 JWMW523 姓 畦 40A405C 40 范 寸 LED 帮 是 平 
¥ 4.599.00 2014 新 品 机 ) 板 电 视 USB 条 攀 体 措 放 

羊 2.999.00 ¥ 3.399.00 站 2.899.00 


图 12-2 “浏览 此 商品 的 顾客 也 同时 浏览 ”推荐 信息 


. 看 了 最 终 购买 。 根 据 用 户 当 前 的 浏览 推荐 最 可 能 购买 的 商品 ， 按 照 比 例 排序 ， 通 常 在 商品 页 两 侧 出 现 ， 主 要 作用 是 引导 用 户 消费 并 促进 用 户 下 单 。 图 12-3 所 示 为 用 户 看 了 某 商 品 推荐 信息 之 后 最 终 购 
买 了 推荐 商品 比例 。 


12_6 的 了 购买 3.44%9 购 买 2.45%0 则 | 习 


联 相 (Lenove) G470A 些 陋 AA9U3) A45El3 些 研 (ASU93) AGS5EI3 拒 太 (ASUS) N46EI3 


L 1 0 车 寸 第 i0 本 电脑 61VD-SL 董 记 本 电脑 24VD- 人 SL 营 10 本 岂 脑 (1l 21VZ-SL 笔记 本 电脑 
¥2,699.00 ¥4,799.00 ¥3,688.00 ¥5.899.00 


图 12-3 “浏览 此 商品 的 顾客 最 终 购买 了 ”推荐 商品 的 比例 


. 其 他 用 户 在 看 。 根 据 用 户 的 浏览 历史 ， 推 荐 和 该 用 户 浏览 行为 类 似 的 其 他 用 户 最 可 能 浏览 的 内 容 ， 通 常 出 现在 页 面 底部 ， 主 要 作用 为 引导 用 户 浏览 并 起 到 辅助 购买 的 效果 。 图 12-4 所 示 为 “查看 此 商 
品 的 顾客 也 查看 了 ”的 推荐 信息 。 


盘 看 此 隘 mm 有 的 局 窜 世 查看 了 


Panasonic 松下 TH-42A Panasonic 松下 ITH-L39E ”Panasonic/ 检 下 TH-42A ”SHARP 夏普 LCD-40DS 
¥2999.00 ¥5294:00 ¥2,99900 ¥359900 ¥ 2,989,00 ¥ 2098.00 ¥3499:60 
直言 育 言 让 [21) 育 育 次 育 雄 (5) 


图 12-4 “查看 此 商品 的 顾客 也 查看 了 ”推荐 信息 


除了 以 上 具有 个 性 化 的 推荐 信息 外 ， 针 对 用 户 的 浏览 推荐 在 特殊 情况 下 还 可 能 包括 : 最 热 商品 排行 、 最 新 更 新 商品 、 评 论 最 多 的 商品 等 。 


2. 根 据 购买 数据 的 个 性 化 运营 


根据 购买 数据 的 个 性 化 运营 主要 应 用 于 销售 提升 过 程 ， 是 提高 网 站 订单 转化 率 、 客 单价 、 重 复 购买 率 的 主要 途径 之 一 ， 广 泛 应 用 于 加 入 购物 车 和 提交 订单 等 页 面 。 


一 、 


. 加 入 购物 车 的 推荐 。 当 用 户 将 商品 加 入 购物 车 后 ， 会 根据 加 入 购物 车 的 商品 推荐 其 他 可 能 一 起 购买 的 商品 ， 主 要 作用 是 提高 单 次 购物 车 的 商品 数量 。 图 12-5 所 示 为 在 加 入 购物 车 之 后 推荐 其 他 商品 的 
言 息 。 


四 
请 商品 已 成 荔 克 人 购物 车 ! 
啊 牛 丰 其 有 1 人 件 和 南口 ， 痛 计 ， 千 ,933,.00 = 
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图 12-5 


回力 HL130 妇 款 骨 布 “Devance 虹 8 闫 风 尚 友 
壮 半 色 包 p 阳 限 重 抢购 组 ' 丈 
羊 本 卫生 7.08 革 卫 对 二 


“购买 此 商品 的 顾客 还 购买 了 ”推荐 信息 


@ia 示 有 些 电子 商务 网 站 将 商品 加 入 购物 车 之 后 并 不 会 直接 到 达 “ 我 的 购物 车 ”页 面 ， 而 是 出 现 迷你 窗口 ， 因 此 图 12-5 所 示 的 推荐 信息 可 能 出 现在 迷你 窗口 或 我 的 购物 车 页 面 。 
. 买 了 还 买 了 。 当 用 户 提交 订单 并 到 达 订 单 成 功 页 之 后 ， 可 以 根据 用 户 的 购买 数据 有 和 针对 性 的 推荐 用 户 还 可 能 一 起 购买 的 其 他 商品 ， 这 是 提高 用 户 复 购 率 、 交 又 销售 效果 以 及 单 次 购买 效果 的 重要 步 
了 又。 图 12-6 所 示 为 针对 用 户 已 经 购买 的 商品 推荐 还 可 能 会 购买 的 其 他 商品 。 


购 关 该 商品 的 用 户 还 购 关 了 


| | 
-Ke EEC DE w Or 
康佳 ‘KONKA; LED40F137 


海 二 (Haiery BCD-186KB 
冰箱 186 升 L 骏 门 冰箱 《 银 栋 
¥1388.0 


康 性 ‘KONKA) LED32F117 
0CF 彩 电 , 32 黄 寸 宕 边框 节能 L 
¥1288.0 


“购买 了 该 商品 的 用 户 还 购买 了 ”推荐 信息 
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图 12-6 


人 @@ 记 示 “为 什么 当 用 户 提交 订单 之 后 的 推荐 还 能 继续 提高 单 次 购买 效果 ? 通常 情况 下 ， 在 一 定时 间 内 的 多 个 订单 ， 用 户 可 选择 合并 订单 。 另 外 ， 运 营 人 员 也 会 根据 订单 的 发 货 区 域 、 商 品 库存 等 条 件 判 
断 是 否 需要 合并 订单 。 因 此 ， 多 个 分 散 订单 可 能 会 被 合并 成 一 个 订单 。 订 单 合 并 是 降低 配送 、 提 高 用 户 收 货 体验 的 重要 方式 。 


3. 根 据 搜索 数据 的 个 性 化 运营 

根据 搜索 数据 的 个 性 化 运营 是 所 有 个 性 化 推荐 中 较为 复杂 的 部 分 ， 原 因 是 基于 搜索 的 个 性 化 推荐 增加 了 对 自然 语言 进行 处 理 的 过 程 ， 而 这 个 过 程 相对 复杂 且 准 确 率 要 求 较 高 。 根 据 搜索 词 的 个 性 化 推荐 
目前 主要 应 用 于 以 下 两 种 形式 : 
一 是 当 用 户 搜索 完成 后 ， 会 在 搜索 页 面 侧 边栏 或 底部 出 现 “ 搜 索 x x 的 用 户 最 终 购买 了 ”， 这 部 分 是 与 上 述 推荐 结果 类 似 的 信息 展示 。 


二 是 推荐 系统 会 在 用 户 搜索 结果 下 面 提示 “相关 搜索 词 ”信息 ， 用 来 确定 搜索 需求 、 扩 大 搜索 学 围 、 提 高 搜索 质量 等 。 图 12-7 所 示 为 当 用 户 搜索 Elle 之 后 推荐 的 其 他 搜索 词 


ELLE 女 包 ”ell] elle 牛 皮 女 包 elle 忆 


图 12-7 “相关 搜索 词 ”推荐 结果 


除了 以 上 用 户 的 行为 类 型 外 ， 其 他 可 能 出 现 的 推荐 场景 包括 : 基于 用 户 评论 的 推荐 、 基 于 收藏 的 推荐 、 基 于 关注 的 推荐 等 ， 其 推荐 方式 与 上 述 场景 类 似 。 
4. 根 据 用 户 复合 数据 的 个 性 化 运营 
以 上 几 种 应 用 场景 基本 是 基于 单一 类 型 算法 及 数据 的 推荐 结果 ， 某 些 情 况 下 也 会 出 现 通过 多 种 模型 或 数据 的 整合 来 进行 个 性 化 推荐 的 案例 ， 例 如 猜 你 喜欢 、 为 你 推荐 、 可 能 感 兴趣 的 商品 等 。 


这 种 应 用 方式 主要 发 生 在 不 具有 明显 的 用 户 喜 好 特征 或 可 进行 离线 运算 的 推荐 场景 ， 例 如 个 人 中 心 、 着 陆 页 等 ， 通 过 综合 用 户 的 浏览 、 购 买 等 行为 ， 推 荐 和 用 户 最 相关 的 信息 。 图 12-8 所 示 为 会 员 中 心 
的 “为 您 推荐 ”信息 。 
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图 12-8 会 员 中 心 的 “为 您 推荐 ”信息 
12.4.2 个 性 化 网 站 运营 的 离线 应 用 
除了 在 线 应 用 ， 个 性 化 还 可 以 应 用 到 网 站 离线 运营 的 很 多 环节 。 
1. 根 据 在 线 事件 的 个 性 化 触发 
在 网 站 运营 中 会 根据 特定 运营 目标 设 定 在 线 触 发 规则 ， 例 如 : 
` 注册 确认 。 当 用 户 注册 成 功 后 向 用 户 发 送 注 册 成 功 信 息 。 
:订单 挽回 。 当 登录 用 户 将 商品 加 入 购物 车 但 未 完成 购买 时 ， 通 过 信息 提示 用 户 继续 购买 。 
这 些 在 线 运营 动作 可 以 与 个 性 化 信息 相 结合 ， 通 过 更 精准 的 信息 推送 达到 提升 运 莒 效果。 例如 : 
` 注册 确认 。 妆 发 送 注册 成 功 信息 时 ， 根 据 用 户 所 填写 的 资料 推荐 其 他 类 似 用 户 感 兴趣 的 信息 ， 或 将 网 站 TOP 信 息 发 送 给 客户 以 增加 客户 黏 性 和 回访 。 


: 订单 挽回 。 在 提示 用 户 继续 购买 的 过 程 中 ， 可 以 根据 用 户 网 站 浏览 产品 的 相关 信息 提炼 关键 促销 点 。 例 如 ， 用 户 浏览 商品 时 频繁 查看 优惠 券 信 息 ， 在 推送 信息 时 可 有 针对 性 的 发 送 优惠 券 以 便 促 成 订 
单 挽回 。 


2. 根 据 离线 规则 的 个 性 化 触发 
离线 规则 指 运 营 规 则 的 触发 处 于 离线 状态 ， 由 于 规则 的 应 用 场景 具备 更 长 的 时 间 以 及 更 有 规律 的 触 友 ， 因 此 个 性 化 信息 可 极 大 的 改善 离线 运营 规则 的 实施 效果 。 例 如 : 
* 特殊 用 户 事件 。 在 用 户 生 日 时 为 用 户 发 送 祝 福 信 息 是 维系 用 户 关系 的 基本 动作 ， 如 果 在 信息 中 加 入 用 户 喜 欢 的 资讯 或 商品 等 信息 ， 会 提高 用 户 对 网 站 的 忠诚 度 。 


* 用 户 流失 挽回 。 对 于 处 理 即将 流失 的 用 户 群体 ， 在 通过 邮件 、 短 信 等 推送 信息 或 通过 呼叫 中 心 进行 用 户 挽回 时 ， 可 根据 其 他 类 似 已 经 挽回 用 户 的 典型 特征 进行 精准 内 容 推 送 。 另 外 ， 个 性 化 运营 规则 
不 仅 能 对 流失 用 户 提 供 “ 亡 羊 补 牢 ”的 帮助 ， 还 能 帮助 运营 人 员 识 别 流失 用 户 ， 从 而 起 到 “防微杜渐 ”的 作用 。 


12.5 “个 性 化 网 站 运营 的 实现 

在 个 性 化 网 站 运营 中 有 关 个 性 化 推荐 的 技术 架构 和 实现 原理 与 个 性 化 媒体 投放 基本 一 致 ， 在 此 不 作 赣 述 (具体 内 容 请 见 第 10 章 的 10.4 和 10.5 节 的 内 容 ) 。 除 此 以 外 ， 个 性 化 运营 的 实现 还 需要 注意 以 下 
几 点 。 

1. 本 地 化 或 云 服 务 


大 型 企业 出 于 数据 安全 性 等 因素 的 考虑 通常 会 将 数据 本 地 化 ， 因 此 在 使 用 站 内 个 性 化 推荐 或 运营 系统 时 强调 本 地 化 的 部 署 和 应 用 。 从 长 远 来 看 ， 本 地 化 不 仅 可 以 提高 数据 的 安全 性 ， 还 更 加 利于 企业 数 
据 的 整合 实现 、 定 制 开 发 、 性 能 拓展 及 应 用 拓展 。 因 此 ， 本 地 化 是 大 型 企业 的 重要 需求 。 


但 是 ， 本 地 化 部 署 除了 需要 具有 一 定 的 人 力 、 财 力 、 物 力 的 支持 外 ， 还 需要 较 长 的 部 署 、 开 发 、 测 试 和 上 线 周期 ， 对 于 大 多 数 中 小 型 企业 来 讲 实施 难度 较 大 。 另 外 ， 基 于 云端 的 个 性 化 推荐 方案 具 
有 “上 线 即 用 ”的 特点 ， 更 适合 中 小 型 企业 应 用 。 


2. 大 数据 平台 集成 与 单独 系统 应 用 

大 数据 平台 包含 了 整个 企业 的 站 外 广告 投放 数据 、 用 户 行为 数据 、 交 易 数据 、 商 品 数据 、 物 流 配 送 数据 、 仓 储 数 据 、 客 服 数据 、 财 务 数据 等 ， 个 性 化 推荐 系统 所 依赖 的 技术 平台 可 以 作为 大 数据 平台 的 
一 部 分 。 因 此 ， 将 个 性 化 推荐 系统 与 大 数据 平台 集成 是 未 来 发 展 的 必然 趋势 ， 个 性 化 推荐 系统 也 将 作为 大 数据 应 用 体系 的 一 个 构件 而 人 存在 。 

ia 大 数据 平台 集成 并 非 一 朝 一 夕 就 能 完成 的 ， 是 在 整体 规划 和 架构 设计 的 基础 上 ， 根 据 业 务 需 求 的 迫切 程度 、 重 要 程度 和 实现 难度 综合 决策 并 实施 。 个 性 化 推荐 系统 可 作为 整体 设计 的 一 部 


分 ， 通过 不 断 拓 展 功 和 E 和 周边 应 用 ， 最 终 集 成 到 整个 大 数据 平台 。 


3. 多 业务 系统 整合 与 单独 系统 应 用 
个 性 化 运营 的 重要 步骤 是 将 数据 系统 与 网 站 运营 系统 打通 ， 这 样 才能 直接 通过 系统 之 间 的 信息 交互 完成 个 性 化 应 用 。 与 个 性 化 推荐 系统 结合 紧密 的 网 站 运营 系统 包括 : 内 容 管理 系统 、 客 户 管理 系统 、 
站 外 广告 投放 系统 、 活 动 营销 系统 、 邮 件 系统 、 短 信 平 台 等 ， 具 体 结合 形式 如 下 。 
. 内 容 管 理 系统 : 在 内 容 管理 系统 中 单独 设置 个 性 化 推荐 区 域 ， 并 将 个 性 化 推荐 系统 的 结果 通过 该 区 域 展示 ， 目 的 是 提高 用 户 体验 及 内 容 匹 配 度 。 
. 客户 管理 系统 : 通过 将 客户 管理 系统 与 个 性 化 推荐 系统 打通 ， 将 已 登录 用 户 的 个 性 化 系统 与 客户 管理 系统 信息 整合 ， 并 通过 特定 接触 点 形成 用 户 精准 营销 和 个 性 化 信息 的 站 内 、 外 推送 ， 以 此 提高 
户 患 诚 度 、 访 问 黏 性 并 最 终 提 高 用 户 转化 和 订单 效果 。 


将 个 性 化 推荐 系统 与 站 外 广告 投放 系统 相 结合 ， 将 用 户 喜 好 数据 与 广告 投放 数据 进行 关联 ， 针 对 不 同 用 户 在 不 同 平台 的 行为 做 个 性 化 广告 投放 ， 提 高 广告 点 击 率 、 网 站 访问 


: 站 外 广告 投放 系统 : 通过 
深度 和 最 终 转 化 率 ， 同 时 还 能 降低 营销 成 本 ， 提 高 ROI。 


' 活动 营销 系统 : 与 内 容 管理 系统 相似 ， 在 活动 营销 系统 中 单独 建立 个 性 化 信息 模块 ， 通 过 用 户 对 不 同 活 动 的 反馈 来 提高 活动 推送 的 精准 度 ， 最 终 提 高 促销 活动 及 宣传 的 效果 。 
* 邮件 系统 : 将 个 性 化 推荐 系统 与 邮件 系统 打通 后 ， 在 对 用 户 的 邮件 进行 推送 的 过 程 中 加 入 用 户 喜 好 、 和 群体 喜好 内 容 ， 提 高 邮件 打开 率 、 点 击 率 以 及 到 达 网 站 后 的 转化 和 重复 购买 率 。 


* 短信 平台 : 通过 打通 个 性 化 推荐 系统 与 短信 平台 ， 在 对 用 户 信 息 进 行 推 送 时 ， 通 过 个 性 化 和 针对 性 强 的 信息 标签 进行 用 户 提醒 ， 进 而 提高 用 户 关 怀 和 信息 推送 的 效果 。 


4. 多 平台 应 用 与 APP 应 用 


个 性 化 运营 可 以 应 用 到 手机 端 ， 但 和 Web 端 相 比 其 应 用 具有 特殊 性 。 


应 用 程序 开发 要 求 增加 。 在 使 用 APP 时 ， 用 户 会 更 加 关注 程序 对 手机 空间 的 占用 情况 、 对 网 络 流量 的 使 用 情况 以 及 应 用 时 的 流畅 度 ， 如 果 在 个 性 化 运营 的 信息 交互 过 程 中 出 现 如 页 面 打 开 速 度 慢 、 流 


应 
使 用 过 高 等 情况 ， 会 导致 用 户 体验 下 降 其 至 直接 印 载 应 用 。 


二 


展示 空间 有 限 。 与 Web 不 同 的 是 ，APP 的 展示 空间 只 限定 在 狭小 的 手机 屏幕 区 域 。 由 于 手机 端 屏 幕 限制 而 无 法 提供 过 多 的 信息 展示 功能 ， 这 限制 了 个 性 化 信息 推荐 的 展示 。 
` 应 用 场景 更 加 具体 。APP 可 以 追踪 到 应 用 设备 的 时 间 、 地 理 位 置 、 联 网 环境 、 手 机 号 等 ， 这 使 得 获得 用 户 具体 场景 信息 的 可 能 性 增加 ， 同 时 也 可 以 针对 用 户 在 不 同 场景 推荐 不 同 的 内 容 。 例 如 ， 当 用 
户 在 大 型 商场 时 可 能 更 需要 时 尚 消费 咨询 ， 而 当中 午 12 点 时 可 能 更 需要 个 性 化 餐饮 消费 信息 。 
“ 个 性 化 运营 针对 性 更 强 。 每 种 应 用 都 可 以 对 应 到 一 个 人 ， 因 此 个 性 化 的 APP 运 营 只 要 针对 APP 和 触发 业务 动作 便 可 直接 映射 到 APP 背 后 的 使 用 者 。 基 于 这 一 特性 ， 只 要 用 户 使 用 APP， 运 营 人 员 便 可 以 精 
确 区 分 和 识别 每 个 用 户 ， 并 针对 不 同 用 户 做 基于 群 组 、 个 性 化 的 运营 动作 。 
- 跨 设备 和 跨 平 台 的 推荐 。 通 常情 况 下 ， 当 用 户 使 用 多 个 平台 或 设备 时 ， 其 数据 无 法 进行 关联 。 但 当 用 户 登 录 之 后 ， 所 有 的 数据 便 可 通过 登录 ID 关联 起 来 ， 基 于 整合 后 的 分 析 和 推荐 ， 运 营 人员 可 以 随 
自 


时 随地 、 跨 平台 、 跨 设备 的 进行 信息 推荐 。 


. 用 户 需求 识别 难度 增加 。APP 上 的 数据 除了 网 站 端 基本 的 点 击 、 浏 览 、 购 买 等 行为 外 ， 还 包括 更 多 非 结构 化 的 数据 ， 如 语音 、 地 理 位 置 、 拍 照 、 视 频 等 ， 这 些 数 据 的 采集 和 分 析 挖 据 将 成 为 APP 个 性 化 


运营 的 重点 和 难点 。 

目前 主流 的 针对 APP 的 个 性 化 推荐 和 运营 主要 采用 以 下 两 种 形式 。 

形式 一 : 通过 调用 网 站 端的 挖掘 结果 来 实现 APP 个 性 化 运营 。 这 种 形式 节省 了 APP 数 据 回 传 后 做 分 析 挖 掘 的 时 间 ， 从 而 提高 了 信息 反馈 效果 并 降低 了 数据 交互 量 ， 但 会 导致 运营 内 容 不 够 个 性 化 、 匹 配 
度 不 高 的 问题 。 


` 形式 二 : 只 针对 APP 上 的 简单 场景 进行 应 用 。 这 些 场 景 主要 是 基于 页 面 浏 览 的 数据 ， 如 内 容 页 、 商 品 页 等 ， 目 的 是 做 更 好 的 内 容 展 示 。 但 问题 在 于 数据 的 应 用 场景 过 少 ， 个 性 化 运营 效果 不 明显 。 


12.6 “个 性 化 网 站 运营 遇 到 的 问题 


1. 底 层 系统 绑架 问题 
很 多 企业 的 后 端 运营 管理 系统 不 仅 繁多 而 且 混 杂 ， 尤 其 是 采购 并 应 用 国外 运营 系统 的 公司 ， 由 于 自身 技术 开发 能 力 不 足 、 开 发 经 验 较 少 等 原因 ， 实 际 上 已 经 被 IT 系统 绑架 ， 导 致 资源 整合 能 力 差 、 个 性 
化 运营 系统 的 开发 很 难 实现 。 

2. 内 部 利益 协调 问题 

个 性 化 运营 系统 的 出 发 点 是 解决 公司 级 资源 优化 和 配置 问题 ， 但 很 多 时 候 公司 整体 利益 与 部 门 利益 之 间 存 在 冲突 ， 在 公司 利益 最 大 化 的 前 提 下 会 使 得 原 有 利益 集团 损失 既得 利益 。 因 此 ， 单 纯 靠 一 个 音 
门 来 推动 公司 级 个 性 化 运营 的 落地 实现 则 会 困难 重重 。 

3. 推 荐 系统 本 身 存在 的 问题 

与 此 同时 ， 个 性 化 运营 系统 在 底层 规则 处 理 上 仍然 存在 一 定 的 难度 。 

. 不 同 店铺 间 的 商品 推荐 。 假 如 网 站 存在 多 个 店铺 ， 如 何 确定 店铺 间或 店铺 内 的 商品 推荐 关系 ? 或 者 ， 如 果 用 户 喜欢 一 个 产品 ， 应 该 推荐 哪个 店铺 的 商品 ? 


: SKU 唯 一 性 问题 。 对 于 电子 商务 网 站 而 言 ， 同 样 的 商品 会 存在 多 种 颜色 、 款 式 、 号 码 、 大 小 等 ， 但 实际 上 这 些 商品 背后 对 应 的 是 同一 个 商品 ， 如 何 对 相同 商品 进行 识别 和 去 重 是 商品 推荐 的 重要 问 
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: 分 地 域 库存 问题 。 大 型 电 商 的 信息 展示 通常 基于 本 地 库存 ， 如 何 将 企业 地 域 库存 与 用 户 地域 、 推 荐 商品 信息 快速 打通 并 实时 反馈 是 一 个 难点 ， 尤 其 是 企业 SKU 达 到 百 万 级 以 上 时 实现 难度 会 更 大 。 


" 人 工 干预 过 多 的 问题 。 在 网 站 运营 过 程 中 会 面临 企业 内 部 多 个 利益 群体 的 博弈 ， 由 此 会 导致 人 工 干 预 规则 过 多 ， 甚 至 会 把 个 性 化 信息 区 域 变 成 另 一 个 广告 展示 区 域 。 


. 商品 状态 更 新 的 问题 。 很 多 企业 的 商品 调整 和 优化 频率 很 高 ， 例 如 价格 调整 、 商 品 上 下 架 、 商 品 促销 状态 更 改 等 ， 如 何 保证 实时 推荐 结果 是 最 新 的 商品 状态 是 保证 推荐 结果 的 重要 内 容 。 例 如 推荐 结 
果 不 可 能 是 一 个 已 经 下 架 的 商品 。 


12.7 本 章 小 结 


本 章 阐 述 了 数据 驱动 下 的 个 性 化 运营 应 用 ， 需 要 读者 重点 掌握 的 知识 点 如 下 : 

` 个 性 化 网 站 运营 应 用 的 场景 ， 包 括 在 线 和 离线 个 性 化 应 用 ， 重 点 是 离线 规则 的 应 用 。 

` 个 性 化 网 站 运营 实现 过 程 中 的 关键 点 及 遇 到 的 问题 。 

个 性 化 网 站 运营 的 基础 是 站 内 用 户 行为 的 采集 以 及 对 用 户 行为 挖掘 后 的 运营 应 用 ， 关 键 落 地 点 是 与 网 站 运营 系统 的 打通 整合 。 根 据 打通 整合 的 难 易 程度 可 分 为 两 个 以 下 层面 : 
* 第 一 个 层面 ， 在 线 个 性 化 应 用 ， 即 直接 在 网 站 中 整合 个 性 化 推荐 系统 ， 这 是 最 为 容易 实现 的 部 分 。 

. 第 二 个 层面 ， 离 线 个 性 化 应 用 的 实施 难度 较 大 ， 建 议 从 公司 最 关心 的 订单 挽回 和 用 户 挽回 切入 ， 然 后 逐渐 扩大 到 完整 的 离线 应 用 。 

为 了 深化 读者 对 本 章 内 容 的 理解 ， 希 望 读者 思考 以 下 几 个 问题 : 

:电子 商务 的 结算 页 面 很 少 有 推荐 信息 ， 为 什么 ? 


对 于 个 性 化 运营 的 实际 效果 ， 应 该 通过 哪些 指标 或 维度 进行 评估 ? 


` 第 13 章 ”数据 风险 管理 与 控制 
. 第 14 章 ”数据 质量 把 控 与 建设 


. 第 15 章 ”数据 投入 与 产 出 管理 


. 第 16 章 ”数据 流程 与 落地 管理 


第 13 章 ”数据 风险 管理 与 控制 


前 面 几 篇 的 内 容 分 别 从 数据 入 门 、 数 据 准备 和 数据 应 用 三 个 角度 介绍 了 如 何 从 一 个 执行 者 的 角度 进行 思考 和 实践 。 作 为 职业 发 展 的 必 经 之 路 ， 每 个 从 业 人 员 都 会 面临 从 执行 层 走向 管理 层 甚至 是 核心 领 
导 层 ， 如 何 从 全 局 的 角度 思考 问题 、 如 何 把 握 企 业 数据 的 脉搏 并 审时度势 是 这 一 阶段 的 重点 。 


从 本 章 开始 将 陆续 介绍 有 关 数 据 风险 管理 与 控制 、 数 据 质量 把 控 与 建设 、 数 据 投入 和 收益 评估 、 数 据 流 程 与 落地 管理 的 相关 话题 ， 以 帮助 读者 建立 全 局 领导 观 。 本 章 的 核心 是 数据 风险 管理 与 控制 ， 分 
别 从 数据 风险 管理 的 概念 、 类 型 、 原 则 与 管理 控制 等 方面 进行 详细 剖析 。 


13.1 数据 风险 管理 的 概念 

数据 风险 指 企业 在 使 用 数据 (采集 、 人 存储 、 挖 气 和 应 用 ) 的 过 程 中 所 面临 的 风险 ， 其 产生 原因 通常 是 企业 内 部 数据 架构 、 流 程 、 制 度 和 标准 不 完善 ， 数 据 不 仅 不 能 为 企业 带 来 促进 作用 ， 反 而 存在 危害 
企业 发 展 的 可 能 性 。 

为 此 ， 数 据 风 险 管理 应 运 而 生 。 数 据 风险 管理 指 对 企业 内 数据 使 用 过 程 中 的 风险 进行 识别 、 评 估 、 分 析 和 处 理 ， 通 过 一 定 的 措施 进行 风险 管控 ， 以 实现 数据 安全 并 有 效应 用 的 管理 方法 。 


数据 资产 作为 企业 资产 的 一 部 分 ， 正 越 来 越 成 为 企业 核心 竞争 力 的 主要 组 成 部 分 。 数 据 风 险 管理 与 政策 风险 管理 、 战 略 风险 管理 、 财 务 风险 管理 、 市 场 风险 管理 、 运 营 风险 管理 、 团 队 风 险 管理 和 法 律 
风险 管理 等 共同 组 成 企业 风险 管理 体系 。 因 此 ， 数 据 风险 管理 与 控制 将 成 为 企业 风险 管理 的 重要 组 件 。 


数据 风险 管理 不 是 单独 存在 的 一 个 实体 ， 而 是 贯穿 于 整个 企业 内 部 各 个 环节 的 管理 机 制 ， 它 具有 以 下 几 个 特点 : 
. 它 的 目的 是 协助 实现 企业 和 部 门 的 目标 ， 而 不 是 数据 风险 管理 本 身 。 

` 它 的 实现 依附 于 其 他 业务 主体 ， 涉 及 企业 内 部 数据 流转 相关 的 所 有 中 心 、 部 门 和 人 员 ， 贯 穿 于 业务 过 程 的 始终 。 
` 它 是 辅助 战略 和 战术 目标 实现 的 一 种 方法 ， 但 不 是 唯一 方法 。 


` 它 的 内 涵 包 括 目标 确定 、 风 险 识别 与 评估 和 风险 处 理 与 监督 三 层 内 容 ， 而 不 仅仅 是 风险 处 理 。 


13.2 ”数据 风险 管理 的 类 型 


数据 风险 管理 与 控制 涉及 数据 整个 的 工作 流程 ， 包 括 数 据 采 集 、 数 据 存 储 、 数 据 分 析 与 挖 扎 和 数据 应 用 ， 但 从 风险 管理 的 方面 来 看 ， 可 以 分 为 两 类 : 数据 信息 安全 管理 和 数据 应 用 风险 管理 。 


1. 数 据 信 息 安全 管理 


数据 信息 安全 管理 是 在 数据 工作 过 程 中 为 防止 信息 泄露 、 信 息 丢 失 、 数 据 损坏 等 信息 危害 的 管理 措施 ， 管 理 对象 是 数据 本 身 。 


(1) 数据 信息 泄露 管理 
数据 信息 泄露 管理 主要 指 对 企业 内 部 的 营销 规划 、 客 户 信 息 、 财 务 数 据 、 商 品 数据 、 库 存 数 据 等 关乎 企业 核心 竞争 力 的 机 密 资 料 和 数据 进行 安全 管理 ， 以 防止 被 其 他 主体 或 个 人 获取 。 如 果 这 些 数据 被 
竞争 对 手 窃取 并 利用 ， 将 会 对 企业 的 生产 经 营造 成 不 可 估量 的 灾难 性 影响 。 


信息 泄露 可 能 发 生 在 数据 从 产生 到 最 终 应 用 的 各 个 环节 ， 主 要 产生 场景 如 下 : 
内 部 人 员 的 无 意 泄密 。 由 于 系统 中 毒 而 导致 的 信息 资料 被 窃取 、 无 意 间 将 企业 内 部 信息 携带 到 外 部 环境 、 与 外 部 人 员 沟通 时 无 意识 的 数据 披露 等 都 会 导致 池 密 情况 的 发 生 。 


“ 内 部 人 员 的 有 意 泄密 。 内 部 人 员 出 于 利益 、 权 利和 其 他 关系 ， 有 意 出 卖 公司 内 部 数据 而 导致 信息 泄露 ， 这 是 信息 安全 管理 的 应 对 场景 和 监督 对 象 。 


数据 查看 权限 失控 。 企 业内 部 的 不 同 级 别人 员 的 权限 管理 不 当 ， 造 成 可 访问 数据 范围 、 导 出 和 保存 权限 的 混乱 等 ， 这 些 将 增加 高 级 机 密 或 核心 数据 被 获取 并 传播 的 风险 。 


. 加 密 管 理 问题 。 企 业内 、 外 部 流转 的 数据 文档 、 文 件 等 ， 通 常 需要 根据 不 同 的 应 用 场景 和 应 用 权限 进行 加 密 ， 一 旦 加 密 管 理 制 度 缺 乏 良好 的 实施 管理 ， 将 导致 信 息 传播 时 不 受 控制 。 
. 黑客 或 间谍 活动 。 很 多 黑客 和 间谍 通过 技术 手段 入 侵 企 业内 部 的 数据 节点 以 获得 关键 信息 ， 这 是 企业 数据 安全 管理 中 最 为 重要 ， 也 是 最 为 困难 的 部 分 。 


isa 示 数据 信息 泄露 的 人 员 不 仅 包 括 企业 外 部 人 员 ， 还 包括 企业 内 部 人 员 。 凡 是 被 不 具有 知晓 权利 的 相关 人 员 获 得 了 数据 信息 都 算是 数据 信息 泄露 的 范畴 。 


(2) 数据 信息 丢失 管理 


数据 信息 丢失 管理 指 通过 一 定 的 措施 防止 数据 丢失 的 管理 方法 ， 数 据 丢 失 通 常 发 生 在 三 个 阶段 : 


数据 采集 丢失 。 在 数据 采集 阶段 数据 就 已 经 发 生 丢 失 的 情况 ， 常 见于 在 数据 开发 和 采集 阶段 由 于 软件 、 硬 件 或 客观 情况 的 变更 导致 的 数据 采集 缺失 。 例 如 服务 器 故障 、 硬 盘 空 间 不 足 、 软 件 编译 执行 


问题 、 数 据 采 集 规划 不 全 面 、 业 务 需求 变更 等 都 会 导致 这 个 问题 。 
全 注 总 随 着 业务 客观 环境 、 运 营 水平 以 及 需求 的 变化 ， 业 务 对 数据 需求 可 能 发 生 改 变 ， 而 作为 数据 开发 人 员 不 可 能 立即 根据 业务 需求 调整 数据 采集 策略 ， 这 就 要 求 在 数据 采集 初期 ， 数 据 分 析 师 需 要 
与 业务 、 产 品 经 理 、 开 发 工程 师 详细 沟通 数据 需求 ， 并 在 开发 初期 提供 尽量 完善 的 数据 监测 和 采集 方案 ， 以 避免 后 期 进行 大 规模 的 数据 二 次 开发 。 


. 数据 存储 丢失 。 在 数据 存储 过 程 中 ， 由 于 存储 设备 的 区 辑 原因 如 感染 病毒 、 误 格式 化 、 设 备 断 电 、 文 件 系 统 错 误 等 ;物理 原因 如 硬盘 损坏 ; 固件 原因 如 固件 使 用 次 数 过 多 导致 的 无 法 正常 识别 数据 设 


备 等 导致 的 数据 丢失 。 另 外 地 震 、 江 水、 雷电 等 不 可 抗力 因素 也 可 能 导致 数据 存储 丢失 。 


数据 编辑 丢失 。 对 于 数据 的 删除 或 清空 操作 如 数据 删除 、 表 删除 、 表 清空 等 权限 ， 必 须 进 行 严格 的 权限 限制 ， 否 则 将 可 能 导致 严重 的 数据 丢失 问题 。 


(3) 数据 信息 质量 管理 


数据 信息 质量 管理 指 对 数据 质量 进行 把 控 ， 通 过 维护 或 提高 数据 质量 来 保证 后 期 数据 应 用 的 稳定 性 及 可 靠 性 ， 良 好 的 数据 质量 是 产生 数据 价值 的 基本 前 提 。 数 据 信息 质量 的 下 降 通常 由 三 个 原因 导致 : 


数据 采集 验证 缺陷 。 在 数据 采集 初期 ， 如 果 没 有 良好 的 数据 质量 验证 和 数据 校 验 规则 ， 可 能 会 出 现 所 采集 的 数据 质量 低 ， 表 现 为 数据 空 值 多 、 数 据 长 度 短 并 丢失 重要 信息 、 数 据 缺 乏 关联 主键 、 数 据 


键 值 匹配 错误 等 。 数 据 采集 缺陷 很 难 通 过 后 期 的 数据 维护 进行 修复 。 因 此 ， 在 数据 采集 阶段 的 数据 质量 验证 是 保证 数据 质量 的 第 一 步 。 


数据 编辑 权限 失控 。 对 于 数据 可 编辑 操作 如 更 新 、 插 入 等 ， 需 要 区 分 场景 和 对 象 进行 权 限 控制 ， 否 则 可 能 由 于 操作 问题 而 影响 数据 质量 ， 最 终 导致 “垃圾 数据 ”的 产生 。 


人 @@ 记 示 “在 大 多 数 情况 下 ， 数 据 的 任何 操作 都 是 在 非 生产 数据 库 中 进行 的 ， 这 意味 着 即使 出 现 数据 误 操 作 也 能 通过 生产 数据 库 重 新 更 新 。 但 即便 如 此 ， 数 据 权限 的 严格 管理 仍然 必 不 可 少 ， 重 新 更 新 所 


消耗 的 服务 器 资源 、 时 间 成 本 、 人 力 成 本 以 及 对 其 他 关联 业务 的 影响 都 会 构成 潜在 的 风险 ， 某 些 情 况 下 可 能 是 重大 影响 ， 例 如 实时 数据 决策 、 到 期 的 应 付 账 款 等 。 

. 数据 生命 周期 原因 。 很 多 企业 在 使 用 数据 的 过 程 中 ， 不 注意 数据 生命 周期 的 管理 和 维护 ， 由 此 导致 数据 质量 下 降 及 后 期 数据 应 用 问题 的 产生 。 

a 示 任何 事物 都 有 生命 周期 ， 数 据 也 不 例外 。 数 据 生 命 周 期 包括 在 线 阶段 ( 指 采集 、 处 理 、 应 用 等 ) 、 离 线 阶 段 (主要 指数 据 备 份 和 归档 ) 、 销 毁 阶 段 (数据 删除 或 销毁 ) 。 定 义 数 据 的 生命 周期 
介绍 


IJ) Po 


不 仅 能 保证 数据 质量 ， 还 能 提高 数据 应 用 效率 和 效果 ， 同 时 可 减轻 IT 运 维 的 负担 。 关 于 数据 生命 周期 的 话题 会 在 稍 后 的 章节 中 详细 


2. 数 据 应 用 风险 管理 


数据 应 用 风险 管理 指 企业 在 应 用 数据 的 过 程 中 通过 一 定 的 流程 、 机 制 和 标准 ， 指 导数 据 应 用 的 可 理解 性 、 可 应 用 性 以 及 有 效 性 ， 最 大 化 减少 数据 应 用 风险 的 管理 机 制 。 


ia 目前 大 多 数 企业 的 数据 风险 管理 主要 集中 在 信息 安全 管理 ， 而 对 于 数据 应 用 风险 管理 关注 较 少 。 数 据 应 用 风险 管理 是 数据 管理 的 辅助 决策 、 了 驱动 业务 落地 的 有 效 手段 ， 同 时 也 是 盘活 数据 资产 


的 重要 保障 。 但 由 于 在 数据 应 用 风险 管理 的 过 程 中 需要 大 量 兼 具 业 务 知识 、 数 据 知识 的 复合 型 人 才 ， 且 应 用 过 程 中 对 于 管理 目标 的 制定 尚 没 有 统一 标准 ， 因 此 建立 并 完善 这 一 内 容 需 要 足够 的 知识 、 经 验 


耐性 和 信心 。 


数据 应 用 风险 常 出 现在 数据 抽样 错误 、 数 据 处 理 错 误 、 数 据 分 析 和 挖 扬 错 误 、 数 据 展现 错误 、 数 据 理 解 错误 和 数据 应 用 错误 这 六 个 场景 。 
数据 抽样 错误 ， 指 数据 样本 选择 时 出 现 的 错误 ， 主 要 表现 为 使 用 错误 的 抽样 方法 及 选择 过 少 的 样本 量 ， 这 些 问 题 最 终 导 致 数据 样本 无 法 代表 全 部 样本 特征 或 无 法 满足 分 析 需 求 ， 而 基于 此 分 析 产 生 的 
结论 也 将 缺乏 可 信 度 。 


. 数据 处 理 错误 ， 包 括 对 数据 异常 值 、 空 值 、 错 误 值 的 处 理 错误 ， 数 据 抽取 格式 、 条 件 和 转换 错误 等 ， 这 些 将 导致 原始 数据 的 质量 偏 低 ， 甚 至 某 些 异常 值 还 会 对 后 期 的 分 析 和 挖 据 工作 造成 直接 影响 。 


. 数据 分 析 和 挖掘 错误 ， 主 要 指 在 数据 分 析 和 挖掘 的 过 程 中 使 用 了 错误 的 分 析 和 挖掘 方法 ， 或 选择 了 拟 合 程度 较 低 的 模型 等 ， 最 终 将 导致 结论 的 错误 或 不 可 信 。 例 如 ， 使 用 变量 间 的 相关 关系 来 代替 因 
果 关 系 做 数据 预测 。 


' 数据 展现 错误 ， 由 于 图 形 扭曲 、 特 殊 坐 标 轴 处 理 、 特 殊 标记 、 数 据 单位 转换 等 造成 的 数据 展现 错误 ， 直 接 结果 是 导致 数据 汇报 对 象 的 理解 错误 。 


" 数据 理解 错误 。 由 于 业务 方 自身 知识 、 经 验 和 能 力 造成 的 数据 理解 偏差 ， 可 能 导致 后 期 在 数据 应 用 和 落地 时 出 现 误导 。 


* 数据 应 用 场景 错误 。 例 如 将 Apriofi 模 型 结果 应 用 于 具有 明显 序列 特征 的 关联 分 析 场 景 中 、 使 用 时 间 序 列 预测 具有 自 变 量 的 预测 场景 ， 以 及 将 变量 在 小 范围 的 拟 合 关系 扩大 到 大 范围 场景 中 应 用 等 。 


数据 应 用 对 企业 或 业务 部 门 最 终 产生 的 影响 可 分 为 三 类 : 第 一 类 是 正面 的 影响 ， 即 从 数据 中 获得 了 更 好 的 决策 建议 ;第 二 类 是 无 影响 ， 即 数据 没有 产生 任何 作用 ; 第 三 类 是 消极 的 影响 ， 即 企业 或 业务 
部 门 被 数据 误导 ， 从 而 制定 了 错误 的 决策 。 上 述 六 个 场景 大 多 数 情况 下 会 总 来 第 三 类 的 影响 ， 而 数据 应 用 风险 管理 的 核心 内 容 就 是 针对 第 三 类 的 影响 。 


全 ;说 在 企业 内 部 ， 数 据 相 关 部 门 是 一 个 介 于 业务 体系 、 职 能 体系 与 技术 体系 之 间 的 交叉 部 门 ， 因 此 其 架构 可 能 出 现在 上 述 三 个 体系 中 。 但 作为 不 直接 产生 实际 业务 动作 或 业务 价值 的 部 门 ， 如 果 对 
企业 发 展 产 生 负 面 影响 ， 那 么 就 需要 考虑 数据 部 门 存 在 的 意义 。 因 此 ， 数 据 是 一 把 双 刃 剑 ， 能 否 用 好 关键 靠 企业 的 数据 相关 部 门 。 


但 是 ， 上 述 六 个 场景 也 只 是 表象 特征 ， 我 们 由 表 及 里 进行 分 析 ， 到 底 又 是 哪些 根本 性 的 原因 产生 了 这 些 表象 ”笔者 在 此 归纳 为 以 下 两 方面 的 内 容 。 


一 是 数据 本 身 的 局 限 性 ， 包 括 数据 采集 初期 样本 量 不 足 、 数 据 非 结 构 化 特征 、 数 据 分 析 和 挖掘 算法 的 局 限 性 、 数 据 只 能 反映 结果 但 无 法 解释 原因 等 。 这 些 因 素 导 致 了 数据 在 处 理 问 题 时 会 遇 到 无 法 跨越 
的 障碍 ， 同 时 由 于 其 无 法 进行 自我 鉴定 和 评估 ， 更 无 法 实现 自我 修复 。 例 如 ， 抽 样 不 能 保证 小 范围 数据 每 次 都 被 抽 中 的 概率 ， 基 于 历史 环境 的 数据 结论 在 面 对 新 环境 时 会 显得 力不从心 。 


二 是 数据 应 用 流程 的 不 规范 性 。 数 据 在 业务 应 用 之 前 需要 经 过 多 个 步骤 ， 无 论 哪个 步骤 出 现 问 题 都 会 对 后 期 应 用 产生 影响 。 如 果 这 个 过 程 缺 乏 必 要 的 培训 、 监 督 、 约 束 等 条 件 ， 每 个 环节 都 会 由 于 不 可 
控 而 导致 数据 应 用 结果 不 理想 。 


13.3 ”数据 风险 管理 的 原则 


1. 树 立正 确 的 数据 安全 观念 


众所周知 ， 数 据 是 企业 的 重要 资产 之 一 ， 运 用 得 当时 还 会 成 为 企业 的 核心 竞争 力 。 但 如 果 因为 惧怕 数据 风险 而 将 数据 限制 起 来 ， 那 么 数据 将 无 法 体现 其 价值 ， 甚 至 企业 还 要 为 维护 数据 而 人 花费 额外 的 硬 
件 、 软 件 、 人 力 和 时 间 成 本 等 ， 最 终 它 会 成 为 企业 的 “ 负 资 产 ”。 


作为 企业 的 领导 者 和 数据 部 门 的 负责 人 需要 平衡 数据 风险 与 回报 的 关系 ， 在 降低 数据 风险 的 基础 上 产生 最 大 的 数据 回报 ， 而 任何 只 看 风险 或 只 看 回报 的 做 法 都 是 不 当 的 。 
同时 ， 作 为 企业 内 部 的 相关 人 员 ， 在 接触 数据 的 整个 过 程 中 都 需要 树立 风险 意识 、 增 强 防范 措施 ， 避 免 由 于 自身 导致 的 数据 风险 问题 ， 数 据 安全 永远 是 任何 数据 工作 的 首要 前 提 。 
2. 建 立 系统 的 数据 安全 机 制 


数据 安全 机 制 并 不 是 某 个 部 门 或 某 个 人 员 的 事情 ， 数 据 安全 机 制 需要 从 数据 源头 抓 起 ， 并 跟踪 到 数据 落地 应 用 的 最 终 环节 ， 因 此 数据 安全 管理 涉及 所 有 与 数据 有 关 的 业务 部 门 。 同 时 ， 除 了 数据 自身 的 
流程 规范 之 外 ， 还 需要 有 相关 管理 部 门 进行 风险 把 控 和 监督 ， 例 如 计划 部 、 管 理 部 、 内 审 部 等 ， 进 行 两 个 层次 、 综 合 防范 和 治理 是 建立 安全 机 制 的 基础 。 


除了 制度 和 流程 的 约束 外 ， 数 据 安全 机 制 的 落实 还 需要 有 自动 化 、 智 能 化 的 工作 方式 ， 专 门 的 技术 或 工具 必 不 可 少 。 例 如 流程 跟踪 系统 、 权 限 控制 系统 、 预 警 工 作 系 统 、 防 入 侵 系统 等 。 


13.4 数据 风险 管理 与 控制 


数据 风险 管理 与 控制 的 对 象 包括 业务 主体 和 数据 主体 两 部 分 ; 从 数据 风险 管理 与 控制 的 流程 来 看 ， 分 为 目标 设 定 、 识 别 与 评估 、 处 理 与 监督 三 个 阶段 。 

1 数据 风险 目标 设 定 

数据 风险 目标 设 定 包括 业务 目标 设 定 和 数据 目标 设 定 。 

(1) 业务 目标 设 定 

业务 目标 基于 企业 和 业务 应 用 主体 设 定 ， 通 常 将 KPI 设 定 为 业务 目标 ， 示 例如 下 : 

“ 销售 额 提升 50%。 

“ 妥 投 率 提 升 25%。 

. 会 员 数 增加 20000 人 。 

这 些 目标 的 设 定 随 着 业务 主体 的 不 同 而 有 所 差异 ， 而 同一 业务 主体 在 不 同时 间 内 的 目标 也 会 发 生变 化 。 因 此 ， 业 务 目标 设 定 值 变化 较为 频繁 ， 属 于 动态 目标 学 畴 。 
(2) 数据 目标 设 定 


与 业务 目标 相对 的 是 数据 目标 ， 数 据 目 标 是 针对 数据 主体 产生 的 ， 其 目的 是 保证 数据 的 最 终 产 出 价值 ， 并 对 数据 主体 的 各 个 方面 、 不 同 环节 进行 评估 。 由 于 变化 幅度 小 、 调 整 频率 低 ， 数 据 目 标 属于 静 
态 目 标 范畴 ,具体 包括 以 下 几 方 面 的 内 容 。 


1) 数据 质量 目标 。 

数据 质量 通常 从 完整 性 、 一 致 性 、 及 时 性 、 有 效 性 、 正 确 性 、 真 实 性 六 个 方面 进行 衡量 。 

“ 完整 性 : 数据 的 完整 程度 ， 指 没有 丢失 数据 记录 或 数据 值 的 比例 。 

:一致 性 : 同一 维度 或 分 析 对 象 在 不 同 库 、 表 间 的 标识 相同 、 约 束 条 件 一 致 、 数 据 值 相 等 。 

“ 及 时 性 : 数据 更 新 是 否 能 满足 业务 应 用 的 需求 程度 ， 具 体 视 业务 需求 而 定 ， 如 果 业 务 需 要 每 小 时 应 用 数据 ， 数 据 及 时 性 要 求 就 是 小 时 ; 如 果 是 每 天 看 数据 ， 及 时 性 要 求 就 是 天 。 


有 效 性 : 数据 是 否 符合 应 用 需求 以 及 满足 需求 的 程度 。 


: 正确 性 : 数据 正确 与 否 以 及 正确 的 比例 。 


“ 真实 性 : 评估 数据 的 来 源 是 否 真实 ， 识 别 其 中 造假 数据 。 
2) 数据 安全 目标 。 
数据 安全 评估 通常 从 以 下 几 个 方面 入 手 。 
* 备份 覆盖 度 : 指 进行 备份 的 数据 的 覆盖 程度 ， 同 时 基于 不 同 数据 的 重要 性 还 可 设置 备份 频率 、 备 份 份 数 、 备 份 介质 数 等 评估 维度 。 


* 防护 覆盖 度 : 指 入 侵 检测 系统 、 防 火 墙 、 杀 毒 软件 、 密 保 措 施 、 权 限 控制 、 身 份 验证 措施 对 所 有 服务 器 、 客 户 端 的 覆盖 比例 。 


. 预警 履 盖 度 : 预警 机 制 对 所 有 数据 范围 的 和 覆盖 程度 ， 无 论 是 访问 异常 、 数 据 异 常 等 均 可 进行 信息 预警 。 


< 


“ 物理 安全 性 : 对 数据 机 房 物理 环境 、 服 务 器 环境 进行 进入 控制 、 监 控 与 警报 的 覆盖 程度 。 
` 动态 保护 系数 : 通过 动态 准 入 地 址 、 口 令 、 密 码 、 数 字 签 名 等 进行 保护 覆盖 程度 。 
3) 数据 应 用 目标 。 
数据 应 用 目标 主要 用 来 评估 数据 在 应 用 过 程 中 的 质量 情况 以 及 所 产生 的 价值 。 
" 数据 可 接触 比例 : 评估 应 该 接触 到 数据 但 由 于 各 种 原因 未 能 接触 到 数据 的 比例 。 
* 数据 到 达 率 : 评估 数据 实际 接触 的 业务 主体 与 理论 上 应 该 接触 到 业务 主体 的 比例 。 


* 数据 覆盖 范围 : 度量 数据 在 业务 应 用 各 个 环节 的 参与 和 禾 盖 程度 。 例 如 通常 情况 下 数据 只 在 发 生 业 务 产生 动作 之 后 参与 进来 ， 但 数据 还 可 以 在 业务 动作 发 生 之 前 、 发 生 过 程 中 参与 进来 。 


“ 数据 正确 率 : 基于 数据 的 业务 驱动 效果 可 通过 数据 做 进一步 的 衡量 ， 正 确 率 即 正确 场景 占 所 有 驱动 场景 的 比例 。 
. 直接 数据 价值 : 通过 数据 自身 的 建议 或 落地 动作 直接 提升 的 销售 、 订 单 和 利润 情况 ， 排 除 业 务 改 进 带 来 的 贡献 ， 只 评估 数据 的 贡献 。 
:间接 数据 价值 : 指 通过 数据 建议 以 及 业务 自身 优化 共同 产生 提升 的 销售 、 订 单 和 利润 贡献 情况 。 


数据 自动 化 程度 : 评估 数据 工作 体系 和 流程 中 系统 自动 化 的 实现 程度 ， 自 动 化 程度 越 高 可 以 减少 更 多 的 人 人力、 物力 和 时 间 成 本 ， 从 而 提高 数据 应 用 效率 和 应 用 效果 。 


` 数据 智能 化 程度 : 评估 数据 自我 学 习 和 智能 工作 的 程度 ， 数 据 智能 化 程度 是 数据 产生 价值 的 重要 途径 ， 同 时 也 是 未 来 数据 工作 发 展 的 重要 方向 。 
2. 数 据 风 险 识别 与 评 佑 

数据 风险 识别 与 评估 是 针对 数据 工作 过 程 中 可 能 产生 的 潜在 风险 进行 评估 和 判断 ， 以 确定 风险 产生 的 可 能 性 以 及 存在 条 件 和 影响 的 过 程 。 

数据 风险 识别 主要 依靠 两 个 方面 开展 : 一 是 数据 部 门 与 业务 部 门 的 主观 经 验 (包含 风险 感知 和 经 验 判断 ) ; 二 是 客观 数据 (包含 数据 结论 、 预 警 模 型 等 ) 。 
数据 风险 识别 和 评估 包括 以 下 几 方 面 的 内 容 。 

* 数据 质量 风险 : 判断 数据 是 否 存 在 质量 隐患 ， 如 缺失 、 不 一 致 、 错 误 、 造 假 、 不 及 时 等 。 

* 数据 安全 风险 : 判断 数据 是 否 存 在 安全 隐患 ， 重 点 是 非法 使 用 、 丢 失 、 入 侵 、 损 坏 等 。 

` 应 用 风险 评估 : 对 于 业务 应 用 和 实施 过 程 中 存在 的 数据 误导 及 其 他 影响 业务 主体 和 数据 主体 目标 实现 的 重大 隐患 进行 评估 。 

数据 风险 识别 的 基本 原则 如 下 。 

: 周期 性 原则 : 数据 风险 识别 与 评估 不 是 一 次 性 工作 ， 它 需要 定期 开展 和 维护 。 

差异 性 原则 : 不 同 周期 、 不 同 频率 内 的 识别 范围 、 监 测 方法 和 实施 过 程 是 不 同 的 。 


. 系统 性 原则 : 数据 风险 识别 与 评估 是 一 个 系统 性 工作 ， 需 要 全 部 相关 部 门 和 人 员 参 与 。 


. 全 面 性 原则 : 数据 风险 识别 需要 针对 所 有 相关 节点 和 环节 开展 ， 而 不 应 该 仅仅 关注 其 中 某 几 个 环节 ， 全 面 性 原则 要 求 对 数据 流通 的 所 有 环节 进行 监督 。 
数据 风险 评估 的 结果 根据 其 影响 的 类 型 可 分 为 以 下 三 种 。 

负面 影响 : 风险 结果 是 负面 的 ， 对 企业 和 部 门 发展 有 消极 影响 。 

` 无 影响 : 风险 结果 没有 任何 影响 。 

. 正面 影响 : 风险 结果 是 正面 的 ， 对 企业 和 部 门 发 展 有 积极 影响 。 


@ia 示 在 数据 风险 识别 与 评估 的 过 程 中 ， 应 尽量 将 评估 结果 量化 。 除 了 “无 影响 ”之 外 的 正面 影响 和 负面 影响 都 需要 指出 影响 类 型 、 影 响 范围 、 影 响 频 率 、 影 响 程度 ， 理 想 情 况 下 需要 与 公司 核心 业 
务 和 利润 挂 钓 ， 如 此 的 评估 结果 才能 更 有 说 服 力 。 除 了 显 性 影响 外 ， 其 他 隐 性 影响 也 可 以 作为 评估 的 参考 结果 ,例如 时 间 成 本 、 机 会 成 本 等 。 


3. 数 据 风 险 处 理 与 监督 

数据 风险 的 处 理 措施 包括 以 下 四 种 。 

` 规避 : 通过 一 定 措施 规避 数据 风险 ， 包 括 权 限 的 关闭 、 多 数据 节点 的 备份 和 宛 余 、 数 据 文件 永久 性 加 密 、 数 据 信 息 销毁 、 寻 找 蔡 代 性 数据 解决 方案 等 。 
` 减轻 : 通过 一 定 措施 减轻 数据 风险 带 来 的 负面 影响 ， 在 规避 中 的 措施 同样 适用 于 减轻 处 理 。 

` 接受 : 不 采取 任何 措施 ， 接 受 数 据 风险 带 来 的 所 有 影响 ， 包 括 积 极 和 消极 影响 。 

` 扭转 : 通过 一 定 的 方式 扭转 数据 带 来 的 负面 影响 ， 并 使 之 产生 积极 或 正面 意义 。 例 如 通过 数据 风险 问题 而 衍生 出 新 的 业务 模式 或 蛋 利 方式 。 


以 上 的 处 理 结果 通常 是 基于 当 次 风险 事件 而 产生 的 策略 调整 或 补救 措施 ， 同 时 企业 内 部 还 需要 建立 或 完善 数据 风险 管理 机 制 和 流程 体系 ， 并 通过 持续 监督 与 落实 进行 必要 的 调整 。 图 13-1 所 示 为 数据 风 
险 管理 与 控制 体系 的 主要 内 容 ， 这 些 内 容 在 本 章 的 前 面 都 已 经 涉及 。 


第 一 级 ”总体 风险 管理 
数据 风险 值 
| 


第 三 级 ”指标 风险 管理 
备份 缆 居 程度 
防护 履 届 程度 
预 登 缆 关 程度 轿 钴 范围 


| | 
| | 
| \ 
| | 
| 
| | 
| 
| | 
| \ 
| | 
| 妇 性 物理 安全 性 前 率 
| | 
| 
| | 
| | 
| | 
| | 
| | 


动态 保护 系数 在 接 价值 
间接 价值 

智能 化 程度 

自动 化 程度 


图 13-1 数据 风险 管理 与 控制 体系 的 主要 内 容 


为 了 保证 数据 风险 管理 与 控制 体系 的 有 效 落地 ， 需 要 一 定 的 机 制 进行 保证 ， 如 图 13-2 所 示 。 


- 第 一 级 : 企业 监管 部 门 ， 包 括 计 划 部 、 管 理 部 、 内 审 部 和 HR 部 门 ， 这 些 部 门 通 过 对 流程 、 事 件 和 关键 节点 的 管理 与 审查 ， 从 机 制 上 保证 数据 风险 管理 的 制度 落地 ， 其 中 的 HR 部 门 还 会 通过 KPI 考核 、 
数据 风险 管理 得 分 等 机 制 直 接 与 相关 人 员 绩 效 挂钩 。 


. 第 二 级 : 工具 监督 控制 ， 企 业内 部 的 加 密 工 具 、 权 限 配 置 工具 、 验 证 工具 、 防 护 工具 、 识 别 工 具 是 建立 自动 化 实时 监控 、 多 重 保 护 、 动 态 管理 和 不 同安 全 层级 的 基础 ， 同 时 也 是 预防 的 主要 措施 。 数 
据 权 限 最 小 化 、 针 对 不 同 主体 的 分 层 管 理 、 隔 离 信 息 主体 与 访问 主体 是 基础 原则 。 


* 第 三 级 : 数据 部 门 监 控 ， 包 括 数据 备份 、 流 程 跟踪 、 数 据 质量 管理 、 完 善 数据 流程 和 指标 ， 通 过 定期 检查 、 员 工 培训 、 预 和 警 机 制 和 数据 的 智能 应 用 提高 数据 风险 管理 水 平 ， 其 对 员工 的 数据 风险 管理 
培训 也 是 必 不 可 少 的 内 容 。 


. 第 四 级 : 人 员 自 我 约束 ， 人 是 工作 的 主体 ， 解 决 了 人 的 问题 即 可 解决 大 多 数 数据 风险 问题 。 除 了 需要 内 部 员工 提高 数据 安全 意识 、 法 律 意识 、 流 程 意识 和 标准 意识 外 ， 还 需要 同步 提高 其 应 用 技能 ， 
包括 安全 防护 技能 、 工 具 使 用 技能 、 数 据 工作 技能 以 及 其 他 相关 技能 ， 这 些 技能 是 “由 知 到 行 ”的 必要 条 件 。 
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图 13-2 ”数据 风险 管理 与 控制 落地 的 主要 内 容 


Oia 示 在 数据 风险 处 理 与 监督 的 过 程 中 ， 不 仅 要 对 产生 风险 的 直接 主体 进行 管理 ， 还 要 对 产生 风险 的 根源 进行 有 效 防治 ， 这 样 才 能 达到 “标本 兼治 ”的 效果 。 


13.5 ”本 章 小 结 


本 章 主 要 围绕 数据 风险 管理 与 控制 的 有 关 话 题 进行 探讨 ， 需 要 读者 重点 掌握 的 知识 点 如 下 : 
: 数据 风险 管理 的 类 型 ， 由 于 数据 信息 安全 已 经 是 数据 管理 的 已 有 共识 ， 和 希望 读者 重点 理解 和 掌握 数据 应 用 风险 管理 。 
` 数据 风险 管理 与 控制 的 基本 步 又， 尤其 是 处 理 与 监督 方式 的 落地 应 用 。 


数据 风险 管理 与 控制 是 数据 工作 尤其 是 管理 层 中 比较 新 的 命题 ， 国 内 目前 对 这 一 领域 的 关注 和 研究 较 少 ， 这 里 推荐 读者 通过 阅读 《内 部 控制 与 企业 风险 管理 : 实务 操作 指南 (第 2 版 ) 》 一 书 来 增加 对 企 
业 风 险 管理 的 认识 ， 同 时 能 更 好 地 将 数据 风险 管理 与 企业 风险 管理 相 结 合 。 


同时 ， 和 希望 读者 能 够 结合 自身 的 实际 工作 进行 以 下 思考 : 
. 企业 中 是 否 存 在 业务 主体 被 数据 误导 的 问题 ? 如 果 存 在， 哪些 方面 是 可 以 理解 和 改善 的 ， 而 哪些 方面 是 需要 通过 长 期 计划 或 更 多 资源 协调 来 实现 的 ? 


" 如 果 你 作为 数据 部 门 的 负责 人 ， 应 该 如 何平 衡 数 据 安全 与 数据 收益 的 关系 ? 


第 14 章 ”数据 质量 把 控 与 建设 


随 着 数据 类 型 、 数 据 来 源 的 不 断 丰 富 以 及 数据 量 的 快速 增长 ， 企 业 在 数据 管理 工作 和 数据 流程 中 面临 越 来 越 多 的 数据 质量 问题 ， 例 如 多 库 表 间 的 数据 不 一 致 、 数 据 质 量 差 、ETL 和 数据 整合 难度 大 、 数 据 
技术 工作 缺乏 统一 保证 等 ， 这 些 问题 已 经 严重 影响 数据 后 期 业务 应 用 的 效果 甚至 辅助 决策 的 正确 性 。 因 此 ， 数 据 质量 把 控 与 建设 的 重要 性 逐渐 进入 企业 高 层 的 关注 视野 。 


本 章 将 从 数据 质量 的 内 涵 入 手 ， 通 过 介绍 数据 质量 建设 的 基本 原则 、 影 响 数据 质量 的 常见 因素 等 内 容 剖 析 数 据 质 量 的 内 洱 和 外 延 ， 尤 其 对 于 数据 质量 建设 的 必要 性 、 涵 盖 范 围 和 影响 因素 将 进行 重点 讲 
解 ， 最 后 会 从 落地 的 角度 提出 数据 质量 建设 的 框架 。 


14.1 数据 质量 建设 的 内 洱 

本 章 所 指 的 数据 质量 的 核心 是 数据 技术 工作 流程 ， 对 于 数据 落地 和 数据 业务 应 用 中 的 影响 因素 涉及 较 少 ， 关 于 数据 落地 和 业务 应 用 流程 建设 会 在 第 16 章 专门 介绍 。 数 据 质量 问题 可 理解 为 有 没有 数据 、 
数据 能 不 能 用 、 数 据 好 不 好 用 、 数 据 如 何 用 的 问题 。 

1. 数 据 质量 建设 的 必要 性 


不 同 企业 对 于 数据 质量 的 关注 程度 不 同 。 通 常 而 言 ， 大 企业 由 于 自身 数据 量 的 增加 以 及 丰富 的 应 用 场景 ， 对 数据 的 认识 会 更 全 面 ， 因 此 更 加 重视 数据 质量 。 小 企业 由 于 数据 规模 较 小 以 及 业务 需求 不 大 
而 对 数据 的 体会 较 少 。 另 外 ， 大 多 数 情况 下 数据 对 初创 企业 的 直接 利润 贡献 较 小 ， 因 此 不 会 被 企业 过 多 重视 。 


数据 质量 建设 需要 从 企业 初期 开始 规划 并 逐步 实施 ， 而 不 是 等 到 企业 做 大 之 后 ， 否 则 数据 会 由 于 迁移 成 本 高 、 数 据 类 型 混乱 、 数 据 整合 难度 大 、 丢 失 关 键 数据 信息 等 原因 导致 永久 性 数据 质量 的 问题 。 
全 ;说 数据 的 生产 环境 具有 实时 性 特征 。 由 于 数据 采集 问题 导致 的 数据 缺失 、 值 错误 、 丢 失 记 录 等 问题 是 无 法 通过 后 期 处 理 还 原 的 ， 因 此 数据 的 不 可 逆 问 题 将 会 严重 影响 数据 质量 。 


无 论 是 大 企业 还 是 小 企业 ， 数 据 质量 管理 都 没有 得 到 其 应 用 的 重视 程度 ， 根 本 原因 体现 在 数据 成 本 和 产 出 的 关系 上 : 


“ 数据 质量 管理 成 本 高 。 数 据 质量 管理 过 程 涉及 企业 数据 标准 的 规划 和 制定 、 数 据 规 范 的 落实 监督 、 数 据 生 命 周期 等 ， 数 据 质 量 工作 的 每 个 环节 都 需要 大 量 的 人 力 、 物 力 、 财 力 和 时 间 成 本 。 


" 数据 质量 的 效益 和 结果 不 明显 。 大 多 数 企 业 都 没有 把 数据 质量 考核 纳入 区 PI 考 核 体 系 中 ， 即 使 出 现 数据 问题 也 可 以 在 后 期 采用 多 种 处 理 方式 “蒙混 过 关 ” ， 这 些 无 法 被 企业 高 层 发 现 ， 尤 其 对 于 缺乏 
数据 文化 的 企业 来 讲 更 是 大 事 化 小 、 小 事 化 了 。 


事实 上 ， 大 多 数 公司 对 于 数据 质量 的 认识 只 停留 在 “有 数据 ”的 层次 ， 由 于 缺少 完善 的 数据 工作 标准 和 规范 、 数 据 应 用 的 绩效 管理 和 数据 效果 的 验证 ， 常 常 导 致 以 下 的 数据 应 用 问题 : 
. 不 同系 统 出 具 的 企业 关键 指标 不 一 致 。 例 如 ， 销 售 金额 、 订 单 量 、 利 润 。 

` 当 企业 需要 实时 数据 做 辅助 决策 时 ， 发 现 没有 数据 可 以 使 用 。 

. 企业 内 部 不 同 部 门 间 的 数据 无 法 共享 ， 并 且 沟 通 成 本 非常 高 。 

* 领导 在 听取 各 部 门 的 工作 汇报 时 ， 发 现 每 个 部 门 都 在 汇报 相同 的 指标 ， 但 结果 都 不 相同 。 

. 由 于 数据 工作 时 效 性 特征 明显 ， 数 据 工 作者 在 数据 清洗 和 处 理 上 花费 了 大 量 时 间 ， 相 对 的 只 能 减少 在 深入 分 析 和 挖 据 上 的 精力 投入 ， 最 终 的 产 出 价值 和 驱动 效果 有 限 。 

. 企业 内 部 存在 非常 多 的 数据 孤岛 ， 数 据 之 间 无 法 关联 且 宛 余 明显 ，IT 部 门 日 常数 据 维护 需要 投入 很 多 软件 、 硬 件 、 时 间 和 人 力 成 本 。 

以 上 问题 的 长 时 间 累 积 会 导致 数据 工作 的 价值 逐渐 缩小 ， 企 业 对 于 数据 的 认可 度 、 信 任 度 、 依 赖 度 降低 ， 数 据 工作 将 面临 被 企业 边缘 化 甚至 裁撤 的 风险 。 

2. 数 据 质量 建设 的 内 涵 


数据 质量 建设 是 对 数据 规划 、 产 生 、 人 存储 、 分 析 、 应 用 、 维 护 整 个 流程 中 可 能 产生 的 问题 进行 预测 、 监 控 、 识 别 、 处 理 的 过 程 ， 其 内 涵 包 括 数据 和 数据 工作 流程 的 规范 化 、 标 准 化 、 流 程 化 ， 目 的 是 提 
高 企业 数据 应 用 效率 和 实际 效果 。 


大 多 数 企业 的 数据 质量 建设 都 是 IT 部 门 的 工作 ， 而 IT 部 门 通 党 把 数据 清洗 或 ETL 的 过 程 理解 为 数据 质量 建设 。 数 据 清洗 和 ETL 是 数据 质量 建设 的 重要 过 程 ， 主 要 内 容 是 针对 原始 数据 中 的 错误 值 、 异 常 
值 、 缺 失 值 等 进行 处 理 ， 另 外 通过 转换 规则 生成 新 的 数据 。 


但 是 ， 数 据 清洗 或 ETL 只 是 数据 质量 建设 的 一 环 。 数 据 质量 建设 从 数据 规划 开始 ， 贯 穿 数据 从 诞生 到 消亡 的 整个 过 程 ， 它 是 一 个 周而复始 的 循环 。 另 外 ， 数 据 质量 建设 也 不 仅仅 是 针对 技术 体系 的 规范 , 
而 是 需要 约束 所 有 参与 数据 工作 的 技术 体系 和 业务 体系 。 


14.2 ”数据 质量 建设 的 原则 


数据 质量 建设 从 完整 性 、 一 致 性 、 及 时 性 、 有 效 性 、 准 确 性 、 真 实 性 六 个 方面 进行 衡量 。 

1. 完 整 性 

数据 完整 性 包含 数据 值 完整 性 和 数据 库 完整 性 两 方面 的 内 容 。 

(1) 数据 值 完整 性 

数据 值 完整 性 即 数据 值 本 身 的 完整 程度 ， 可 分 为 两 个 层面 : 一 是 数据 库 内 没有 数据 记录 丢失 ; 二 是 每 一 条 数据 记录 内 的 相应 属性 均 没有 缺失 值 。 

举例 : 

: 示例 一 ， 用 户 的 每 个 订单 动作 都 会 触发 订单 记录 ， 如 果 存 在 订单 记录 丢失 ， 那 么 数据 值 不 完整 。 

.示例 二 ， 如 表 14-1 所 示 ， 每 条 数据 均 有 3 个 字段 栏 位 〈 列 ) ， 完 整 的 数据 值 是 三 个 栏 位 的 值 都 是 完整 的 。 如 果 出 现 表 14-1 中 第 二 条 记录 缺失 PhoneNum 值 的 情况 ， 那 么 数据 值 就 不 完整 。 


表 14-1 数据 值 不 完整 性 示例 


12345 18645678902 
23599 13453320191 


全 ;+ 总 在 数据 质量 校 验 过 程 中 ， 数 据 字段 的 缺失 校 验 比较 容易 发 现 ， 而 数据 记录 的 缺失 审查 和 处 理 难度 较 大 ， 原 因 是 数据 记录 的 缺失 通常 需要 多 表 核 对 ， 在 复杂 数据 的 场景 中 实现 较为 困难 。 

(2) 数据 库 完 整 性 

数据 库 完整 性 是 为 了 防止 数据 库 接收 不 符合 定义 规则 的 数据 而 提出 的 ， 即 数据 库 只 能 接收 规则 之 内 的 数据 。 例 如 ， 数 据 库 定义 手机 号 码 的 字段 只 能 是 11 位 字符 串 ， 如 果 出 现 了 位 数 不 对 则 不 予 采集 。 

数据 库 完 整 性 通过 实体 完整 性 、 参 照 完 整 性 、 域 完整 性 、 用 户 自 定义 完整 性 四 个 方面 进行 约束 。 

实体 完整 性 : 实体 即 数据 所 要 描述 的 客观 主体 。 例 如 会 员 、 订 单 等 都 是 数据 实体 《常用 UserID、OtderID 表 示 ) ， 实 体 完整 性 要 求 主键 不 为 空 并 且 唯 一 。 

. 参照 完整 性 : 参照 即 表 之 间 的 主键 和 外 键 关系 。 例 如 ， 订 单 ID 可 能 同时 是 会 员 表 的 外 键 及 订单 表 的 主键 ,通过 订单 ID 可 以 关联 会 员 表 和 订单 表 之 间 的 关系 。 参 照 完整 性 要 求 不 能 引用 不 存在 的 主体 。 
` 域 完整 性 : 域 完整 是 针对 具体 关系 数据 库 的 约束 条 件 ， 反 映 了 具体 应 用 所 涉及 的 数据 必须 满足 的 语义 要 求 。 例 如 ， 数 据 类 型 、 值 范围 、 是 否 为 空 等 。 

* 用 户 自 定义 完整 性 : 指 用 户 自己 定义 必须 满足 的 条 件 。 

全 注意 数据 库 完整 性 是 针对 关系 型 数据 库 而 言 的 ， 而 对 于 NoSQL 等 非 关 系 型 数据 库 则 基本 不 成 立 ， 原 因 是 非 关 系 型 数据 库 强 调 面向 集合 、 模 式 自 由 ， 因 此 不 同行 的 数据 约束 条 件 可 以 完全 不 一 样 。 
2 一 致 性 


与 数据 完整 性 类 似 ， 数 据 值 一 致 性 也 包括 数据 值 一 致 性 和 数据 库 一 致 性 两 方面 。 


(1) 数据 值 一 致 性 

数据 值 一 致 性 指 不 同 库 之 间 、 不 同 表 之 间 代 表 相同 实体 的 数据 值 是 相同 的 ， 以 及 同一 个 数据 对 象 在 不 同 用 户 访问 时 的 值 相同 。 

举例 : 

* 示例 一 ， 用 户 订 单数 据 在 数据 表 A、B、C 中 都 有 涉及 ， 数 据 值 一 致 性 要 求 相同 条 件 下 (例如 相同 时 间 、 相 同 维度 ) 无 论 A、B、C 是 否 处 于 相同 的 系统 、 库 还 是 表 ， 其 结果 要 一 致 。 
“ 示例 二 ， 用 户 User1 和 Uset2 在 访问 数据 表 A 中 的 用 户 订单 数据 时 的 结果 必须 一 致 。 

常见 导致 数据 值 不 一 致 的 原因 包括 以 下 四 个 方面 : 


数据 更 新 延 时 间 题 。 多 个 数据 系统 、 库 、 表 之 间 更 新 都 有 一 定时 间 的 延迟 ， 并 且 视 数据 量 、 更 新 频率 、 更 新 效率 等 的 延迟 时 间 不 同 ， 如 果 时 间 过 长 会 导致 数据 不 一 致 性 的 问题 ， 这 是 最 常见 的 数据 不 
一 致 的 场景 。 


.请求 并 发 控制 问题 。 多 个 用 户 同 时 访问 一 个 数据 对 象 时 ， 由 于 并 发 控制 不 当 而 导致 的 数据 不 一 致 ， 主 要 对 象 是 具有 创建 、 编 辑 和 删除 权限 的 用 户 。 

“ 客观 运行 故障 问题 。 数 据 运 行 所 依赖 的 软件 、 硬 件 、 程 序 甚至 不 可 抗力 因素 导致 的 数据 损坏 或 数据 丢失 问题 也 会 导致 数据 不 一 致 。 

“ 数据 抽取 逮 辑 问题 。 很 多 时 候 ， 不 同系 统 对 同一 对 象 的 抽取 逻辑 是 不 同 的 ， 由 于 逻辑 不 同 导 致 的 数据 不 一 臻 也 很 常见 。 

(2) 数据 库 一 致 性 

数据 库 一 致 性 指 相 同 数据 主体 在 不 同 数据 系统 、 库 、 表 的 标识 相同 、 约 束 条 件 一 致 以 及 数据 库 事务 处 理 的 一 致 。 

举例 : 

.示例 一 ， 用 户 表 、 订 单 表 、 配 送 表单 都 有 关于 订单 的 数据 记录 ， 如 果 三 个 表 对 订单 主体 的 定义 不 一 致 会 造成 后 期 应 用 的 混乱 问题 ， 通 常会 用 统一 变量 名 标识 ， 如 OrdetID。 
: 示例 二 ， 对 于 订单 的 生成 操作 ， 订 单 表 和 商品 表 会 分 别 记录 订单 和 商品 数据 ， 并 且 这 两 个 表 的 事务 处 理 是 一 致 的 ， 否 则 订单 和 订单 商品 信息 无 法 同步 和 关联 。 
3. 及 时 性 

数据 及 时 性 指数 据 满足 业务 应 用 需求 的 及 时 程度 。 以 下 是 时 间 性 较 强 的 业务 需求 : 

` 现在 要 看 公司 的 实时 销售 数据 。 

. 今天 要 看 最 近 7 天 的 订单 变化 趋势 。 

` 今天 要 看 全 年 的 会 员 活 跃 度 情况 。 


任何 业务 对 数据 的 响应 时 间 都 是 有 要 求 的 ， 不 存在 无 限期 的 响应 时 间 (如 果 存 在 ， 那 么 说 明 数 据 对 他 们 已 经 失去 价值 ) ; 但 数据 的 处 理 又 需要 一 定时 间 才 能 完成 ， 尤 其 是 数据 深入 挖 握 和 价值 发 现 需要 
的 时 间 更 长 。 因 此 ， 业 务 的 期 望 时 间 和 数据 处 理 时 间 会 形成 一 对 矛盾 ， 即 数据 及 时 性 矛盾 。 数 据 及 时 性 的 矛盾 主要 存在 于 两 类 场景 : 


. 一 是 实时 数据 。 实 时 数据 的 关键 是 “实时 ”， 比 较 常 见 的 “实时 ”时 间 要 求 是 秒 、 分 级 别 。 实 时 需求 会 对 数据 工作 的 各 个 环节 造成 很 大 的 压力 ， 但 实时 数据 对 业务 的 数据 决策 具有 非常 重要 的 作用 ， 
尤其 是 重大 事件 、 营 销 活动 、 广 告 投放 时 ， 实 时 数据 通过 实时 预警 、 分 析 等 手段 降低 业务 风险 并 尽 可 能 保证 企业 利益 最 大 化 。 


. 二 是 历史 数据 。 历 史 数 据 的 关键 是 “历史 ”， 历 史 数 据 的 主要 特点 是 数据 量 庞大 ， 从 数据 库 中 短 时 间 内 提取 大 量 数 据 是 一 种 挑战 。 例 如 ， 订 单 表 中 每 天 的 订单 数据 正常 导出 需要 两 小 时 ， 如 果 要 导出 
一 个 月 的 数据 至 少 需要 60 小 时 《在 不 考虑 异常 条 件 的 前 提 下 ) ， 再 加 上 数据 处 理 和 挖掘 的 时 间 可 能 已 经 无 法 满足 业务 及 时 性 的 要 求 。 


4. 有 效 性 

数据 有 效 性 指数 据 是 否 符 合 应 用 需求 以 及 满足 需求 的 程度 。 数 据 有 效 性 的 内 容 包 括 数据 格式 、 数 据 类 型 、 数 据 值 范 围 以 及 其 他 业务 规则 。 
以 用 户 留存 率 分 析 为 例 ， 以 下 两 种 情况 说 明 数 据 有 效 性 较 低 : 

“ 情况 一 ， 原 始 数 据 中 没有 用 户 启 动 时 间 惟 的 字段 ， 因 而 无 法 进行 留存 率 分 析 。 

. 情况 二 ， 原 始 数据 中 的 启动 时 间 玲 字段 ，75% 数 据 的 值 为 室 ， 这 导致 了 无 法 进行 留存 率 分 析 。 

5. 准 确 性 

数据 准确 性 指数 据 准确 的 程度 。 数 据 准 确 是 数据 工作 的 基本 前 提 ， 同 时 也 是 保障 数据 结果 可 信和 的 必要 条 件 。 

数据 准确 性 主要 受 以 下 三 个 方面 的 影响 : 

" 数据 采集 的 准确 性 。 如 果 原 始 数 据 在 采集 时 数据 就 出 现 错误 ， 那 么 后 期 很 难 纠正 。 


“ 数据 处 理 的 准确 性 。 数 据 处 理 过 程 中 会 涉及 多 种 方法 ， 包 括 抽样 规则 、 昼 党 处理、 处 理 顺 序 、 挖 气 模 型 选择 、 调 参 问题 等 ， 哪 个 环节 处 理 不 当 都 会 影响 数据 的 准确 性 。 


会 取 / 


“ 数据 应 用 的 准确 性 。 主 要 是 数据 指标 、 算 法 、 应 用 场景 、 应 用 逻辑 的 准确 理解 和 使 用 。 例 如 用 销售 额 除 订 音量 无 法 得 出 客 单价 。 


全 涪 在 网 站 数据 工作 中 ， 主 客观 原因 都 会 导致 网 站 分 析 系 统 与 企业 内 部 系统 数据 存在 差异 性 。 虽 然 这 种 差异 性 不 会 对 数据 结果 的 方向 性 造成 重大 影响 ， 但 仍然 会 影响 企业 内 部 对 网 站 数据 工作 价值 
的 信任 度 ， 尤 其 是 关键 数据 。 例 如 订单 、 销 售 量 等 的 差异 会 导致 企业 领导 层 怀疑 数据 的 可 信 度 。 一 一 当 你 还 在 使 用 不 准确 的 数据 时 ， 如 何 能 保证 数据 结果 一 定 是 正确 的 ? 


6 .真实 性 
数据 真实 性 指数 据 的 来 源 和 结果 真实 ， 并 且 其 解读 过 程 真 实 有 效 。 数 据 的 真实 性 可 从 三 个 方面 进行 衡量 : 
. 一 是 数据 来 源 是 否 真实 ， 造 假 数据 、 捏 造 数据 都 违反 真实 性 原则 。 


. 二 是 数据 结果 是 否 真 灾 ， 是 否 出 现 由 于 数据 展现 而 造成 的 数据 误解 以 及 数据 结果 的 错误 。 有 关 数 据 欺 骗 请 见 第 1 章 1.3 节 “识别 网 站 数据 具有 欺骗 性 的 三 种 形态 ”。 
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实 性 ， 是 否 在 数据 解读 过 程 中 奔 大 或 忽略 客观 事实 ， 形 成 明显 的 对 数据 现象 、 本 质 和 落地 建议 的 利益 取向 问题 。 例 如 ， 故 意 夺 大菜 些 部 门 在 促销 活动 中 的 贡献 。 


@@ 注 意 ”数据 真实 性 是 数据 工作 的 底线 ， 主 观 上 的 造假 行为 不 仅 关系 到 工作 的 结果 问题 ， 还 关系 到 个 人 信誉 及 品质 问题 ， 这 会 对 从 业者 整个 职业 发 展 造成 非常 恶劣 的 影响 。 


14.3 ”影响 数据 质量 的 常见 因素 


1. 数 据 标准 管理 的 影响 

数据 标准 管理 也 可 以 理解 为 元 数据 管理 ， 元 数据 是 关于 数据 的 数据 ， 即 把 数据 作为 一 项 主体 对 待 ， 通 过 数据 对 数据 主体 进行 定义 、 规 范 、 描 述 和 记录 。 

数据 标准 作用 于 数据 工作 的 完整 生命 周期 ， 如 果 没 有 有 效 的 数据 标准 管理 ， 将 导致 以 下 问题 : 

. 不 同 的 开发 人 员 有 不 同 的 开发 标准 ， 数 据 开 发 质量 无 法 保证 。 

. DBA 在 数据 管理 过 程 中 ， 由 于 缺乏 维护 标准 而 导致 数据 丢失 。 

“ETL 人 员 依 靠 自身 对 需求 的 理解 进行 数据 抽取 、 转 换 和 加 载 ， 导 致 结果 和 需求 不 一 致 。 

“ 原 有 的 数据 管理 人 员 离 职 ， 新 入 职 人 员 由 于 没有 数据 标准 可 供 参 考 而 无 法 有 效 进行 数据 维护 ， 其 至 由 于 对 库 表 定义 的 不 确定 而 无 法 提取 有 效 数据 。 

* 相同 数据 主体 在 不 同 库 表 间 的 数据 差异 较 大 。 

. 业务 人 员 无 法 准确 理解 数据 指标 的 含义 ， 数 据 应 用 无 从 谈 起 。 

" 业务 人 员 过 多 的 基本 定义 问题 直接 影响 了 技术 人 员 的 工作 效率 和 效果 。 

造成 以 上 问题 的 根本 原因 可 归结 为 以 下 三 类 : 

“ 第 一 类 是 缺少 数据 标准 ， 即 没有 元 数据 规范 。 

. 第 二 类 是 数据 标准 不 完整 ， 完 整 的 数据 既 包 括 数 据 主体 又 包括 数据 流程 ， 大 多 数 企 业 缺 少 对 数据 工作 流程 的 规范 ， 例 如 协同 工作 流程 、 复 合 指标 定义 规则 、 业 务 应 用 规则 等 。 
* 第 三 类 是 数据 标准 更 新 不 及 时 ， 数 据 标准 同样 需要 与 时 俱 进 ， 需 要 根据 企业 发 展 的 不 同 阶段 及 不 同业 务 的 侧重 点 进行 调整 。 

2. 数 据 客观 环境 的 影响 

数据 客观 环境 既 包括 数据 工作 所 依赖 的 机 房 、 硬 件 、 软 件 、 程 序 等 工作 环境 ， 还 包括 互联 网 等 企业 外 部 大 环境 ， 这 些 环境 的 变化 也 会 导致 数据 质量 的 下 降 。 例 如 : 
:机房 由 于 停电 、 被 资 、 洪 水 等 事故 或 不 可 抗力 的 因素 造成 数据 丢失 或 损害 。 

. 硬件 由 于 使 用 寿命 等 因素 造成 了 数据 物理 损害 。 

软件 和 程序 的 漏洞 、BUG 甚 至 文件 系统 错误 导致 的 数据 系统 无 法 正常 工作 。 

“ 互联 网 访问 的 限制 〈 如 禁止 某 些 网 站 的 访问 和 使 用 ) 、 变 更 或 黑客 入 侵 对 数据 的 恶意 得 改 、 删 除 等 因素 。 

数据 客观 环境 的 影响 大 多 是 由 客观 不 可 控 因 素 造 成 的 ， 但 其 中 也 不 排除 某 些 人 为 足 包 和 工作 漏洞 因素 。 例 如 数据 备份 管理 和 灾难 性 恢复 机 制 的 缺失 、 企 业 网 络 高 危 漏 洞 的 监控 和 修复 缺失 等 。 
3. 数 据 应 用 流程 管理 的 影响 

数据 应 用 流程 管理 指 在 数据 工作 过 程 中 对 数据 工作 流程 、 日 常 维护 、 数 据 使 用 的 管理 ， 常 见 的 应 用 流程 管理 不 规范 的 场景 包括 : 

" 数据 需求 和 开发 信息 不 对 称 ， 导 致 数据 理解 、 数 据 范 围 、 数 据 精 度 、 数 据 粒度 上 出 现 偏差 ， 或 者 在 数据 开发 过 程 中 不 断交 更 需求 而 影响 开发 进度 ，; 

. 缺乏 对 数据 项 目 工作 效果 的 监督 ， 导 致 数据 工作 的 各 个 环节 质量 难以 保障 ; 

“ 数据 维护 和 使 用 规范 不 全 面 ， 缺 乏 统 一 的 落地 标准 ; 

. 缺少 立体 监督 机 制 ， 数 据 部 门 既 是 “运动 员 ” 又 是 “裁判 员 ”， 企 业 难以 全 面 把 控 数据 质量 和 风险 。 


在 数据 的 应 用 过 程 中 ， 除 了 技术 人 员外 ， 业 务 人 员 或 企业 职能 人 员 的 参与 也 会 影响 数据 质量 。 因 此 ， 数 据 质 量 建设 过 程 中 需要 不 同 层级 、 不 同 环节 的 各 个 部 门 都 参与 到 数据 工作 标准 和 规范 的 制定 中 
来 。 


除了 以 上 三 方面 的 主要 影响 因素 外 ， 相 关 数 据 、 技 术 和 业务 人 员 的 自身 意识 、 素 质 、 经 验 和 技能 水 平 ， 企 业内 部 的 数据 文化 和 落地 机 制 ， 企 业 发 展 阶段 和 其 他 客观 环境 也 都 会 影响 数据 质量 ， 但 这 些 因 
素 更 多 属于 数据 工作 不 可 控 的 范畴 。 例 如 ， 企 业 在 发 展 前 期 会 重点 关注 业务 工作 流程 的 规范 和 业务 效果 ， 而 对 于 数据 工作 范畴 的 投入 和 重视 程度 较 低 ， 客 观 上 会 导致 初期 数据 质量 较 低 。 


14.4 ”数据 质量 建设 的 框 染 


数据 质量 建设 需要 从 数据 工作 的 整个 流程 入 手 ， 通 过 全 方位 、 立 体 化 、 动 态 性 的 标准 建立 完善 的 监督 和 管理 体系 ， 如 图 14-1 所 示 。 


图 14-1 ”数据 质量 建设 的 框架 


数据 工作 流程 分 为 数据 层 、 处 理 层 和 应 用 层 : 

* 数据 层 包括 生产 环境 的 原始 数据 采集 、 数 据 ETL 及 数据 整合 和 存储 。 

` 处 理 层 包括 数据 的 分 析 、 挖 掘 和 建 模 处 理 过 程 。 

` 应 用 层 包 括 数据 产品 应 用 、 数 据 报表 、 数 据 接口 和 第 三 方 应 用 等 。 

数据 质量 建设 的 框架 可 分 为 数据 质量 管理 、 数 据 监督 管理 和 数据 生命 周期 管理 三 个 方面 。 
" 数据 质量 管理 : 数据 整个 工作 流程 所 有 环节 的 标准 制定 和 规范 管理 。 

数据 监督 管理 : 通过 数据 对 数据 主体 进行 监控 及 数据 质量 的 分 析 和 改进 。 


" 数据 生命 周期 管理 : 动态 更 新 和 管理 数据 各 个 环节 的 标准 和 规范 ， 使 得 数据 主体 、 数 据 质量 和 规范 、 数 据 监督 管理 不 断 优 化 并 符合 实际 情况 。 


14.4.1 ”数据 质量 管理 


数据 质量 管理 是 数据 工作 的 指导 和 规范 文件 ， 主 要 用 于 数据 的 开 必 、 管 理 、 维 护 、 处 理 和 应 用 的 参照 。 根 据 流 程 可 将 数据 工作 标准 分 为 数据 开发 标准 、 数 据 ETL 标 准 、 数 据 存储 标准 、 数 据 建 模 标准 和 数 
据 应 用 标准 ， 如 图 14-2 所 示 。 
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图 14-2 ”数据 质量 管理 体系 


将 数据 管理 与 数据 存储 合并 ， 同 时 将 ETL 流 


马 


“企业 数据 技术 架构 与 组 成 ”。 在 此 为 了 细 分 各 个 工作 环节 ， 对 原 有 流程 进行 了 适当 的 调整 


关于 数据 技术 架构 与 工作 流程 的 详细 描述 ， 请 见 第 2 章 2.3 节 
程 单独 进行 拆 分 。 

. 数据 开发 : 通过 业务 环境 采集 获取 原始 数据 、 外 部 数据 以 及 手工 录入 数据 。 

` ETL: 原始 数据 通过 ETL 流 程 进行 数据 抽取 、 转 换 和 加 载 ， 对 于 其 中 规则 复杂 的 部 分 配合 ODS 进行 处 理 。 

“ 数据 存储 : 经 过 ETIL 规 则 处 理 后 的 数据 形成 数据 仓库 或 数据 集 市 。 


“ 数据 挖掘 : 通过 数据 挖掘 模型 进行 数据 深入 分 析 ， 得 到 的 数据 标签 或 模型 结果 成 为 数据 仓库 或 数据 管理 平台 的 主要 内 容 ; 部 分 应 用 如 汇总 报表 等 不 需要 挖掘 过 程 ， 因 此 会 直接 到 达 数 据 应 用 层 。 


* 数据 应 用 : 数据 通过 报表 、 数 据 门 户 、OLAP、 数 据 产 品 等 进行 业务 应 用 ， 应 用 数据 可 能 来 源 于 数据 仓库 、 数 据 集 市 或 数据 挖 据 模型 。 


ia ODS 是 一 个 面向 主题 的 、 集 成 的 、 可 变 的 、 当 前 的 细节 数据 集合 ， 常 用 于 向 数据 仓库 进行 过 渡 的 方案 。ODS 与 数据 仓库 的 区 别 在 于 其 主题 集中 度 介 于 分 散 数据 与 数据 仓库 之 间 ， 数 据 通常 只 有 


当前 或 近期 的 数据 ， 支 持 数 据 的 增 、 减 或 删除 动作 。ODS 可 以 在 数据 仓库 与 原始 数据 之 间 形 成 一 条 过 渡 地 带 ， 用 于 完成 到 达 数 据 仓 库 之 前 的 数据 存储 、 处 理 或 特殊 应 用 。 


1. 数 据 开发 标准 
数据 开发 标准 是 针对 数据 采集 过 程 的 标准 ， 不 同 的 业务 系统 具有 不 同 的 开发 标准 和 需求 ， 数 据 开发 标准 需要 涉及 数据 开发 计划 、 测 试 、 实 施 和 上 线 四 部 分 ， 具 体 以 企业 的 实际 情况 为 准 。 


2. 数 据 ETL 标 准 
EL 是 将 源 数据 转换 成 目标 数据 的 过 程 ， 按 照 其 流程 ETL 标 准 涉及 ETL 设 计 、ETL 开 发 、ETL 测 试 和 运 维 四 个 阶段 。 


(1) ETL 设 计 


ETL 设 计 包 括 源 数据 、 目 标 数 据 、ETL 规 则 等 。 
类 型 以 及 其 他 字段 说 明 等 信息 。 图 14-3 所 示 为 一 个 目标 表 内 容 的 一 部 分 。 


vv  “ 表 名 |TableHane_ | 字段 ( 列 ) | 说 明 


源 数据 和 目标 数据 的 标准 涉及 的 内 容 包 括 库 名 、 表 名 、 字 段 名 、 约 束 条 件 、 


品牌 表 |DINM_BRAND IBRANDENAME 品牌 英文 名 
DINM ERAND |TNSERTDT 插入 时 间 
品牌 表 |DINW_BRAND |UEDATEDT 修改 时 间 


图 14-3 ”目标 表 标 准 规范 


ETL 规 则 主要 涉及 表 间 的 关联 和 规律 规则 、 转 换 规则 、 合 并 规则 、 匹 配 规则 、 触 发 机 制 以 及 其 他 复杂 运算 规则 等 。 图 14-4 所 示 为 针对 特殊 转换 规则 进行 的 规则 定义 。 


函数 吉 科 | 输入 输 和 a 瘟 注 
， 地 址 按 小 数 点 分 成 四 个 Sp part1 ~ Dart4d 


conv id [20602198209171010 | ”| 将 15 和 身价 证 转化 成 18 们 身份 许 将 无 效 的 身份 证 信息 去 了 


社 合 规 刚 +86 86 0086 00 0 开头 的 后 面 紧 跟 13# 15#+ 18+* 


十 让 二 二 号 、* 
| 人 reeee< | 再 后 面 紧 跟 8 位 数字 的 手机 号 码 ” 喜 取 《13|15|18) hd{9,9 
Com mobilenumber Il13Bl188893588889 1 388828938889 不 符 言 规则 的 律 置 空 


01351955553858 ls5355989358 


图 14-4 ETI 规则 定义 
(2) ETL 开 发 
ETL 开 发 过 程 中 的 标准 通常 涉及 脚本 语言 和 SQL 语言 两 种 。 


脚本 语言 通用 的 标准 管理 内 容 包括 存放 目录 、 任 务 组 、 程 序 名 、 变 量 名 、 大 小 写 、 任 务 标记 、 脚 本 编号 、 公 用 调度 的 函数 处 理 、 模 板 标准 等 。 除 此 之 外 ， 根 据 结 构 可 分 为 程序 摘 述 区 、 全 局 变量 定义 
区 、 主 程序 体 三 部 分 。 


“ 程序 描述 区 : 脚本 创建 日 期 、 创 建 人 和 修改 记录 。 
. 全 局 变量 定义 区 : 变量 显示 声明 、 通 用 模块 的 引用 、 全 局 变量 定义 ， 具 体 包 括 引 用 顺序 、 初 始 值 声明 、 注 释 强制 性 、 对 齐 和 缩 进 要 求 等 。 
. 主 程序 体 : 函数 组 成 、 复 用 说 明 、 对 齐 和 缩 进 数 、 数 据 读 取 规则 、 赋 值 规则 、 调 用 规则 和 退出 规则 等 。 


SQL 编写 标准 涉及 的 内 容 包括 库 、 表 、 人 存储 过 程 、 宏 、 字 段 名 等 名 称 的 大 小 写 ， 同 级 或 不 同 级 别 SQL 的 缩 进 和 换行 ， 特 殊 符 号 位 置 (如 逗号 位 于 行 首 而 分 号 位 于 行 未 ) ， 别 名 使 用 唯一 性 ， 空 格 使 用 和 
变量 引用 的 规范 性 ， 注 释 的 完整 性 要 求 尤 其 是 其 中 特殊 处 理 的 说 明 ， 内 连接 和 外 连接 的 固定 用 法 及 配合 筛选 条 件 的 使 用 规范 、 空 行 的 使 用 以 及 超 长 脚本 的 注意 事项 等 。 


(3) ETL 测 斌 

在 ETL 开 发 完成 后 ， 通 常 需要 经 过 多 轮 测试 成 功 后 才能 上 线 ; 对 于 测试 的 流程 、 规 范 性 验证 、 性 能 要 求 、 触 发 条 件 等 都 需要 制定 完整 的 标准 。 

(4) ETL 运 维 

ETL 调 度 作业 列表 顺序 和 时 间 、 目 标 数据 更 新 规则 、 版 本 控制 、 错 误 处 理 流程 (根据 抽取 、 转 换 和 加 载 不 同 阶段 进行 细 分 ) 、 调 度 异常 处 理 机 制 、 日 志 检 查 机 制 等 ， 运 营 维护 文档 也 需要 有 统一 的 规范 。 
3 数据 存储 标准 

数据 存储 标准 涉及 数据 仓库 设计 、 数 据 仓库 开发 和 数据 仓库 运 维 三 部 分 。 

(1) 数据 仓库 设计 

数据 仓库 在 实际 开发 之 前 都 会 进行 设计 ， 设 计 阶段 主要 包括 以 下 内 容 。 

` 数据 仓库 层次 结构 设计 : STAGE 接 口 信 息 模 型 、ODS/DWD 信 息 模 型 、MID 信 息 模 型 、DM 信 息 模型 、 元 数据 信息 模型 的 规范 

“ 数据 仓库 设计 : 概念 模型 、 还 辑 模型 和 物理 模型 的 流程 标准 ， 不 同 库 、 表 和 分 区 的 划分 依据 以 及 应 用 场景 ， 库 表 容 量 大 小 限制 和 增长 设计 ， 范 式 参照 依据 及 优化 原则 等 。 

' 分 级 存储 设计 : 根据 数据 访问 频率 、 重 要 性 、 保 留 时 间 、 数 据 量 等 进行 层级 化 存储 ， 包 括 在 线 存 储 、 近 线 存储 和 离线 存储 规则 。 

(2) 数据 仓库 开发 

数据 仓库 开发 主要 包括 以 下 内 容 。 

"数据库 对 象 命名 : 不 同类 型 表 的 前 后 级 规范 ， 如 维度 表 、 事 实 表 、 接 口 表 、 汇 总 表 、 临 时 表 等 ;主键 、 外 键 、 索 引 、 视 图 、 物 化 视图 、 存 储 过 程 等 命名 标准 。 

“SQL 编码 规范 : 除 ETL 中 的 SQL 要 求 外 ， 对 于 全 表 扫 描 、 删 除 、 排 序 、 编 码 、 字 符 长 度 、SQL 语 和 句 优化 和 性 能 控制 等 都 需要 进行 明确 规范 。 

* 数据 字典 : 数据 字典 是 数据 库 开 发 和 实施 的 重要 参考 依据 ， 数 据 字典 的 结构 、 内 容 、 命 名 、 注 册 、 表 达 等 。 图 14-5 所 示 为 流量 数据 仓库 数据 字典 的 部 分 内 容 。 
一 一 一 一 二 一 一 一 
关 报 表 包 int(10) msigned | |3757249664 
EE rr rs re rrr 

一 一 


| USERID : ; Bdd614d 
| IYI3ITOR ID Li |b a IFK | 


区 六 YISITOR ENYIRONNE ISITOR ID 由 wisid i low 组 成 bigint (100) unsigned nn 11111112-14753 


| los ID 用 户 ID varchar (255) FE ”|32265 
|DATE TDE datetine | |38261.00141 


一 ”ec | 一 -一 一 
[一 一 Javascrit 和 的 本本 | 
love veR 0 
[coories ”| 是 省 接 有 Tovasoript 会 话 Cookie char 和 | 7T 
[ff FERSISTENT CooKIE | 表示 是 SEE ookie 和 /或 永 欠 性 Coo NR 
|CT CONNECT TYPE _ i 调制 解 调 器 
上 户外 传说 的 事件 的 数字 ID 3 这 号 分 了 


(3) 数据 仓库 运 维 
数据 仓库 运 维 过 程 中 会 对 日 志 、 异 常 处 理 、 并 行 支持 、 循 环 作业 、 调 度 流程 等 进行 规范 。 


@iaA 数据 字典 与 元 数据 的 区 别 : 通常 而 言 ， 数 据 字典 是 元 数据 的 一 部 分 ; 数据 字段 主要 对 数据 进行 描述 ， 例 如 属性 、 约 束 、 含 义 、 解 释 等 ; 而 元 数据 的 范围 更 广 ， 除 了 对 数据 自身 静态 的 描述 外 ， 
还 包括 对 数据 流程 、 数 据 处 理 等 的 定义 。 


4 .数据 建 模 标准 


这 里 的 数据 建 模 特 指 数据 挖掘 的 建 模 过 程 ，CRISP-DM 模 型 是 目前 数据 挖掘 领域 应 用 最 广泛 、 接 受 程度 最 高 的 挖掘 流程 标准 ， 该 标准 将 数据 挖掘 过 程 分 为 六 个 步骤 ， 如 图 14-6 所 示 。 


商业 理解 | < “| 数据 理解 


数据 准备 


图 14-6 ”CRISP-DM 流 程 


(1) 商业 理解 


商业 理解 是 从 商业 角度 理解 挖 扬 项 目的 目标 和 要 求 ， 然 后 把 理解 结果 转化 为 数据 问题 ， 并 制订 出 一 个 旨 在 实现 目标 的 初步 计划 。 在 此 环节 中 对 于 商业 理解 的 目标 、 要 求 、 内 涵 、 范 围 、 时 间 、 结 果 类 型 
以 及 结果 细节 都 要 做 明确 的 规范 。 


(2) 数据 理解 


数据 理解 是 从 原始 数据 集 开 始 熟悉 和 了 解数 据 ， 并 初步 探索 数据 知识 ， 或 挖掘 有 深层 含义 的 数据 子 集 来 形成 对 隐藏 信息 的 假设 。 数 据 理解 可 以 理解 为 数据 的 可 行 性 研究 ， 即 通过 先期 的 基本 数据 认识 来 
确定 当前 数据 条 件 是 否 可 以 满足 数据 挖掘 所 需 条 件 并 初步 判断 如 何 实现 的 问题 。 


数据 理解 阶段 ， 需 要 确定 源 数 据 标准 如 数据 来 源 、 范 围 、 状 态 或 时 间 性 特征 ， 数 据 集 基 本 特征 如 数据 类 型 、 最 大 值 、 最 小 值 、 均 值 、 标 准 差 、 偏 度 、 唯 一 性 、 有 效 记 录 数 及 数据 分 布 规律 等 。 
(3) 数据 准备 

数据 准备 是 从 原始 数据 集中 按照 数据 理解 的 要 求 和 规则 进行 数据 处 理 的 过 程 ， 这 个 过 程 的 主要 工作 是 数据 清洗 ， 为 下 一 阶段 数据 建 模 准备 数据 。 

这 个 环节 需要 规范 的 内 容 包括 数据 质量 修复 策略 如 极 值 、 异 常 值 和 缺失 值 ， 确 定 抽样 方法 以 及 数据 处 理 过 程 中 涉及 的 数据 类 型 、 格 式 、 条 件 等 转换 规则 。 

(4) 建 模 

在 建 模 阶段 ， 主 要 是 选择 各 种 建 模 技术 ， 同 时 对 参数 进行 核准 以 达到 最 优 拟 合 状态 或 输出 理想 的 挖掘 结果 。 数 据 建 模 阶段 是 整个 数据 挖掘 的 核心 ， 需 要 重点 关注 并 规 学 以 下 几 个 方面 : 

` 应 用 场景 和 算法 类 型 规范 ， 即 不 同 应 用 场景 下 如 何 选 择 挖掘 苯 法 的 类 型 及 优 劣 注释 。 


. 不 同 算法 类 型 及 算法 细 化 ， 例 如 同样 的 关联 规则 细 分 到 交叉 销售 和 向 上 销售 时 各 自 的 算法 。 


参数 调 优 方法 ， 不 同 参数 在 面 对 不 同类 型 、 不 同体 量 、 不 同 场景 和 不 同 目标 下 如 何 调 优 ， 以 及 产生 的 预期 效果 。 
ta 从 数据 挖掘 的 应 用 需求 看 ， 参 数 调 优 是 最 具有 知识 含量 也 是 最 需要 指导 和 规范 的 环节 ， 对 于 这 部 分 内 容 的 标准 化 不 仅 可 以 提高 数据 挖掘 效果 ， 更 有 利于 数据 挖掘 知识 的 沉淀 。 
(5) 评估 
评估 阶段 的 目的 是 保证 数据 挖掘 和 拟 合 结果 符合 数据 实现 逻辑 并 能 实现 业务 目标 。 评 估 是 发 布 或 商业 应 用 前 的 最 后 一 个 质量 把 关 环 节 ， 可 通过 以 下 三 个 标准 进行 度量 
* 用 户 的 满意 程度 。 只 针对 模型 结果 的 应 用 对 象 是 人 ”， 即 业务 人 员 时 才 应 用 的 度量 ， 实 现 业务 需求 是 数据 挖掘 结果 的 基本 要 求 。 


数据 模型 质量 评估 。 数 据 挖 据 模 型 需要 通过 一 定 的 指标 评估 其 拟 合 程度 、 显 著 程 度 或 规则 的 可 用 度 。 不 同 模型 有 不 同 的 评估 指标 ， 例 如 关联 模型 的 支持 度 、 置 信 度 ， 回 归 模 型 中 的 解释 系数 、 工 值 和 P 
值 等 。 图 14-7 所 示 为 决策 树 提 升 效果 图 ， 该 图 中 显示 了 不 同样 本 比例 下 的 提升 幅度 。 


技术 可 用 性 评估 。 对 于 需要 集成 到 其 他 应 用 或 产品 中 的 挖掘 模 型 ， 还 需要 从 技术 上 评估 其 可 用 性 ， 如 规则 应 用 效率 、 并 发 处 理 量 、 响 应 时 间 等 。 
(6) 发 布 


挖掘 模型 的 发 布 意味 着 进入 实际 应 用 或 部 署 阶段 。 数 据 模 型 的 发 布 既是 一 个 模型 的 阶段 性 结束 ， 又 是 下 一 次 调整 的 开始 。 模 型 优化 是 一 个 循序 渐进 的 过 程 。 这 个 阶段 需要 重点 关注 发 布 或 部 署 流程 细 
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图 14-7 决策 树 提 升 效果 图 
5. 数 据 应 用 标准 
数据 应 用 标准 从 实际 应 用 的 角度 描述 了 所 要 应 用 的 数据 或 系统 的 基本 特征 ， 提 供 了 业务 应 用 所 需 的 来 源 、 规 则 、 定 义 和 属 性 等 信息 ， 数 据 应 用 标准 分 为 流程 标准 、 场 景 定义 和 术语 定义 三 个 层面 。 
(1) 流程 标准 


流程 标准 的 核心 是 定义 数据 与 业务 间 的 沟通 和 协作 机 制 ， 包 括 需 求 处 理 流程 、 协 同 测试 流程 、 产 品 开发 参与 流程 等 ， 流 程 规范 是 保证 各 方 有 序 参与 并 高 效率 协作 的 必要 保证 。 


(2) 场景 定义 
场景 定义 主要 规范 不 同 场景 下 如 何 应 用 不 同 的 数据 集 或 数据 结果 ， 大 多 数 企业 的 应 用 场景 可 分 为 报表 应 用 、OLAP、 数 据 库 操 作 、 业 务 部 门 的 数据 挖掘 等 。 
. 报表 应 用 : 定义 不 同 场景 下 查询 报表 的 规范 ， 包 括 库 和 表 查 看 范围 、 权 限 范围 〈 编 辑 、 下 载 、 打 印 等 ) 、 指 标 范围 、 数 据 集 范围 等 。 


" OLAP: 不 同 需求 下 选择 和 应 用 数据 维度 及 指标 的 规范 ， 尤 其 是 避免 细 粒 度 、 长 时 间 范 围 内 的 数据 调用 。 对 于 常用 的 场景 、 维 度 和 指标 的 组 合 可 提供 建议 规则 ， 在 提高 业务 效率 的 同时 也 能 提高 数据 产 
数据 库 操 作 : 数据 库 操作 的 数据 范围 、 访 问 时 间 、 可 编辑 权限 、 验 证 性 访问 规范 、SQL 语 言 规范 ， 重 点 是 通过 标准 来 避免 多 表 关 联 时 的 低 效率 以 及 对 IO 的 过 度 占 用 。 
" 业务 部 门 的 数据 挖 据 : 业务 部 门 导 出 数据 后 自行 进行 数据 挖 据 ， 请 参见 上 节 数 据 建 模 标准 。 
(3) 术语 定义 
术语 定义 包括 维度 和 指标 两 类 ， 维 度 是 对 数据 “ 行 ” 的 描述 ， 指 标 是 对 数据 “ 列 ” 的 描述 。 术 语 定义 需要 重点 规范 以 下 两 个 方面 的 内 容 。 
“ 术语 应 用 场景 ， 即 不 同 场 景 下 应 该 使 用 哪些 术语 。 例 如 评估 流量 质量 时 会 选择 访问 深度 、 跳 出 率 、 转 化 率 等 ,而 UV、PV 都 是 评估 流量 的 指标 。 


“ 术语 的 名 称 、 必 性、 来源 、 计 算 公 式 、 取 值 范围 、 约 束 条 件 等 。 例 如 访问 量 的 定义 会 有 访问 数 、 会 话 数 、 访 问 量 、 访 问 次 数 等 ， 这 些 名 称 需 要 统一 。 另 外 ， 对 于 转化 率 的 定义 ， 适 用 于 公司 级 别 的 通 
用 指标 需要 有 全 局 的 定义 ， 如 有 订单 的 用 户 数 /UV (或 访问 量 ) ; 而 各 个 部 门 做 内 部 分 析 时 可 根据 情况 制定 特有 的 指标 ， 如 销量 /UV 等 。 


合 尘 总 规范 和 定义 术语 标准 是 企业 内 部 数据 流通 和 共享 的 唯一 保证 ， 也 是 内 部 有 效应 用 数据 的 基础 。 如 果 没 有 这 个 过 程 ， 企 业内 部 各 部 门 之 间 无 法 进行 有 效 的 数据 交流 。 例 如 同一 个 销售 额 ， 财 务 、 


销售 、 


1 


销 、 物 流 部 门 的 数据 都 会 不 一 致 。 


14.4.2 ”数据 监督 管理 
数据 监督 管理 是 对 数据 本 身 以 及 数据 工作 流程 进行 监督 和 管理 的 过 程 ， 通 过 实时 监控 与 预警 、 人 工 信 息 校 验 和 和 逐 级 审核 机 制 三 方面 综合 实现 。 


1. 实 时 监控 与 预警 


实时 监控 是 针对 企业 数据 系统 的 动态 进行 实时 监控 ,以 及 时 发 现 数 据 的 不 完整 、 不 一 致 、 不 及 时 和 不 准确 等 异常 ， 并 以 邮件 、 短 信 或 桌面 通知 等 多 种 方式 智能 预警 ， 帮 助 企业 达到 维护 数据 质量 的 目 
实时 监控 包括 以 下 几 方 面 的 内 容 。 


守 


“ 数据 库 工 作 环境 的 监控 : 除了 IT 系统 运 维 所 要 监控 的 服务 器 硬件 和 软件 的 信息 外 ， 还 包括 服务 器 数据 库 表 空 间 及 使 用 率 、 基 本 配置 监视 、 时 间 文 件 性 能 等 


“ 数据 库 工 作 进程 的 监控 : 数据 库 事务 处 理 、 数 据 缓冲 区 、 数 据 库 连接 时 间 、 请 求 统计 、 连 接 统计 、 线 程 统 计 、 缓 冲 统计 、 数 据 库 明细 、 表 锁 统 计 、 会 话 量 、 会 话 等 待 、SQL 占 用 资源 、 链 效率 、 备 份 


明细 、 计 划 工 作 等 。 
` 数据 结果 监控 : 在 终端 数据 结果 中 ， 对 关键 指标 的 数据 异常 、 涨 跌 的 监控 。 
特殊 事件 监控 : 例如 对 黑客 入 侵 、 删 除 关键 表 的 错误 等 的 监控 。 


以 上 监控 通常 需要 通过 系统 检测 工具 或 脚本 触发 实现 ， 并 且 可 以 通过 设置 一 定 的 阀 值 与 触发 方式 配合 预警 后 的 天 键 落地 动作 。 表 14-2 所 示 为 2014 年 8 月 1 日 当天 针对 天 键 指标 由 系统 汇总 的 预警 信息 。 


表 14-2 ”针对 关键 指标 由 系统 汇总 的 预警 信息 


日 期 警告 方式 
2014 年 8 月 1 日 无 
邮件 
民 面 提示 


Bn 储 
FH [ | 


2. 人 工 信 息 校 验 
除了 以 上 系统 自动 监控 信息 外 ， 还 需要 通过 人 工 参 与 进行 关键 数据 的 信息 监控 ， 包 括 以 下 内 容 。 


“日常 数据 校 验 : 通过 汇总 数据 的 记录 数 、 不 同 指标 的 有 效 记 录 数 、 关 键 指 标 在 不 同 库 表 之 间 结 果 的 差异 性 对 比 、ETL 执 行 日 志 校 验 等 方式 确认 数据 是 否 违反 一 致 性 、 及 时 性 、 完 整 性 的 原则 。 日 常 校 
验 的 频率 可 分 为 日 、 周 和 月 ， 校 验 数据 范围 依据 频率 而 定 。 


“ 定时 数据 抽查 : 定时 数据 抽查 是 以 季度 或 半年 的 频率 对 期 间 内 的 数据 进行 抽样 调查 ， 选 择 重 点 库 表 并 配合 随机 抽样 及 关键 指标 校 验 数据 。 
“ 全 面 数据 校 验 : 每 年 组 织 一 次 针对 所 有 数据 仓库 、 集 市 和 数据 表 的 全 面 检 查 ， 包 括 所 有 维度 和 指标 ， 目 的 是 排除 日 常 和 抽样 过 程 中 的 这 漏 信息 以 及 信息 死角 。 


在 人 工 校 验 时 ， 还 需要 通过 数据 总 量 的 容量 、 增 长 速度 、 趋 势 走 向 ， 关 键 细 分 库 表 的 变动 趋势 、 结 构 构 成 、 相 关 程 度 及 重要 变化 进行 统计 ， 找 到 各 指标 的 波动 范围 标准 或 增长 趋势 规律 ， 对 带 有 影响 因 
素 的 因子 ， 如 节假日 等 ， 还 要 加 入 特定 权重 进行 调整 。 表 14-3 所 示 为 针对 某 指标 制定 的 波动 范围 及 阅 值 控制 标准 。 


表 14-3 某 关键 指标 的 波动 评估 


FF 到 


3. 逐 级 审核 机 制 
逐 级 审核 机 制 是 在 数据 应 用 过 程 中 保证 数据 质量 的 重要 关口 ， 该 机 制 的 约束 主要 体现 在 以 下 两 个 场景 。 
* 数据 变更 时 的 逐 级 审核 : 在 对 数据 进行 质 入 、 更 新 、 删 除 、 清 空 等 关键 操作 时 ， 必 须 建 立 逐 级 审核 机 制 ， 尤 其 对 于 数据 表 级 别 影响 范围 较 大 或 删除 、 清 空 等 权限 较 高 的 操作 ， 需 要 审批 后 方 可 执行 。 


. 数据 汇报 时 的 逐 级 审核 : 在 得 到 数据 结果 后 ， 数 据 应 用 部 门 首先 要 进行 内 部 的 逐 级 审核 ， 以 确保 数据 工作 过 程 和 结果 没有 问题 ， 这 个 机 制 对 于 新 入 职 的 员工 尤为 重要 。 
14.4.3 ”数据 生命 周期 管理 


1. 数 据 生命 周期 管理 的 概念 


数据 生命 周期 从 数据 规划 开始 ， 包 括 开发 、 产 生 、 部 署 应 用 、 监 视 、 存 档 和 销毁 ， 是 一 个 不 断 循环 的 过 程 。 数 据 生命 周期 管理 是 通过 对 数据 不 同 阶段 的 有 针对 性 的 管理 措施 来 降低 数据 管理 成 本 ， 提 高 
数据 质量 ， 最 终 达到 数据 价值 最 大 化 的 目的 。 


2. 数 据 生命 周期 管理 的 意义 
数据 生命 周期 管理 对 于 企业 具有 非常 重要 的 意义 ， 主 要 表现 在 以 下 几 方 面 。 
(1) 降低 数据 的 安全 风险 


数据 在 企业 内 人 存在 损毁 、 泄 露 等 显 性 风险 ， 同 时 也 存在 由 于 数据 生命 周期 导致 的 数据 决策 管理 和 数据 驱动 失误 等 隐 性 风险 。 例 如 ， 企 业内 部 可 能 仍然 使 用 早期 的 数据 结论 来 辅助 决策 ， 由 于 时 过 境 迁 ， 
早期 的 数据 结论 可 能 已 经 失去 其 存在 或 应 用 的 条 件 ， 其 结论 的 可 信和 度 需要 重新 评估 ， 混 乱 应 用 将 带 来 决策 风险 。 


(2) 降低 数据 的 维护 成 本 


IT 部 门 在 面 对 越 来 越 多 的 数据 时 ， 其 运 维 过 程 需 要 投入 大 量 的 硬件 、 软 件 、 人 力 、 物 力 和 时 间 成 本 ， 这 会 给 企业 造成 巨大 的 成 本 投入 问题 。 数 据 生命 周 期 管理 可 通过 各 种 措施 ， 尤 其 是 数据 归档 、 销 毁 
等 方式 能 有 效 进行 数据 管理 ， 在 保证 数据 可 用 性 的 同时 还 可 以 有 效 降低 运 维 成 本 。 


(3) 提高 数据 的 质量 
数据 生命 周期 管理 的 重要 内 容 是 针对 数据 本 身 的 管理 ， 通 过 对 数据 的 开发 、 维 护 使 得 数据 进入 “去 伪 存 真 ”的 正 向 循环 ， 越 来 越 多 的 高 质量 数据 的 沉淀 为 后 期 应 用 提供 了 坚实 的 基础 。 
(4) 提高 数据 的 应 用 价值 


随 着 数据 量 的 积累 、 数 据 类 型 的 扩展 等 客观 条 件 和 企业 在 应 用 实践 过 程 中 数据 经 验 的 丰富 等 主观 条 件 的 具备 ， 数 据 生 命 周 期 管理 还 可 以 将 隐藏 在 海量 数据 间 的 深层 关系 挖掘 出 来 ， 最 终 为 企业 辅助 决策 
甚至 为 新 商业 模式 的 探索 提供 有 效 建议 。 


@ia 示 大 多 数 企 业 关注 数据 生命 周期 管理 的 主要 原因 是 ， 降 低 数据 运 维 成 本 和 数据 安全 风险 ， 但 对 于 数据 应 用 价值 的 关注 和 重视 程度 不 高 。 数 据 存 在 的 首要 目的 是 辅助 决策 ， 再 上 一 个 层次 是 数据 驱 
动 ， 如 果 没 有 这 两 方面 效果 数据 将 是 企业 的 “负载 资产 ”， 将 没有 存在 的 必要 性 。 因 此 ， 数 据 生 命 周 期 管理 的 根本 意义 在 于 降低 数据 成 本 的 同时 提高 效益 ， 即 “数据 ROI” 的 优化 管理 。 


3. 数 据 生 命 周期 管理 的 实施 

(1) 数据 规划 

数据 规划 是 数据 生命 周期 的 开始 ， 在 规划 阶段 需要 注意 以 下 几 个 要 素 。 

. 沟通 主体 : 数据 、 技 术 与 业务 共同 参与 并 讨论 数据 采集 规划 ， 三 方 缺 一 不 可 ， 在 提高 效率 的 同时 还 能 降低 沟通 成 本 ， 以 及 在 后 期 调整 成 本 。 

` 沟通 内 容 : 数据 采集 需求 ， 包 括 数据 主体 、 范 围 、 标 准 、 条 件 、 粒 度 等 ; 数据 可 行 性 讨论 ; 预期 产生 的 数据 及 后 期 应 用 方向 以 及 详细 、 具 体 的 书面 描述 。 
.沟通 结果 : 经 过 业务 和 技术 人 员 确 认 后 的 数据 采集 计划 书 ， 包 括 了 数据 采集 的 所 有 内 容 和 方法 。 

(2) 数据 开 皮 

数据 开发 主要 是 技术 实施 的 过 程 ， 在 开发 测试 阶段 也 会 涉及 数据 或 业务 部 门 协助 测试 ， 测 试 过 程 的 要 点 是 全 面 、 细 心 、 准 确 ， 如 果 有 BUG 跟 踪 系 统 最 好 通过 BUG 跟 踪 系 统 跟 进项 目 实施 。 
封闭 测试 也 是 数据 开发 过 程 中 的 重要 内 容 ， 如 果 可 外 部 访问 注意 数据 的 隐秘 性 及 安全 性 ， 测 试 系统 往往 极 容易 遭受 外 部 攻击 。 

(3) 数据 产生 

数据 开发 完成 后 ， 生 产 数据 开始 正式 进入 数据 库 或 日 志 系 统 ， 这 是 后 期 可 供应 用 的 原始 数据 。 

(4) 数据 部 署 和 应 用 


数据 部 署 和 应 用 包括 数据 ETL、 预 处 理 、 分 析 、 挖 掘 、 应 用 、 流 转 和 共享 等 ， 是 数据 产生 价值 的 核心 环节 。 需 要 注意 的 是 ， 数 据 工作 的 对 象 以 及 每 一 个 数据 应 用 主体 都 有 自己 的 生命 周期 ， 例 如 报告 、 模 
型 、 报 表 、 产 品 等 ， 这 些 主体 都 需要 根据 其 自身 的 生命 周期 进行 调整 ， 原 因 如 下 : 


原始 数据 中 出 现 了 新 类 型 的 数据 ， 这 些 数据 可 以 用 来 拓展 新 的 分 析 思 路 。 

. 随 着 高 质量 数据 的 积累 ， 由 于 数据 量 不 足以 产生 可 信 结 果 的 问题 会 逐渐 解决 ， 同 时 隐藏 在 深层 次 的 数据 间 的 关系 会 更 容易 被 挖 据 出 来 。 

. 业务 人 员 在 不 同 阶段 有 不 同 的 关注 点 ， 数 据 结果 需要 随 着 业务 人 员 的 关注 点 而 不 断 演 进 。 

-出现 了 新 的 数据 分 析 和 挖掘 方法 ， 可 以 解决 之 前 不 能 解决 的 问题 。 

. 业务 人 员 的 数据 意识 会 随 着 数据 工作 的 开展 而 提高 ， 以 往 的 数据 知识 已 经 不 能 满足 业务 人 员 的 需求 。 

全 注 读 业务 人 员 数 据 意 识 的 不 断 提高 客观 上 要 求 数据 从 业者 自身 素质 和 能 力也 不 断 提高 ， 通 过 新 技术 、 新 方法 、 新 应 用 和 新 发 现 不 断 驱 动 自身 成 长 。 这 也 是 数据 从 业者 自身 成 长 路 径 的 重要 方面 。 


举例 : 以 一 份 专项 报告 为 例 ， 在 业务 初期 建立 起 专项 报告 机 制 。 随 着 业务 的 发 展 ， 数 据 报告 中 不 断 涉及 新 业务 出 现 规则 的 数据 反馈 ， 同 时 报告 分 析 思 路 也 在 不 断 调整 以 适应 业务 人 员 的 需求 ; 在 业务 主 
体 的 发 展 到 达 顶 峰 时 ， 数 据 分 析 思 路 、 维 度 、 方 法 也 达到 顶峰 。 但 随 着 企业 内 部 调整 及 业务 主体 的 衰落 ， 数 据 报告 的 内 容 也 逐渐 减少 ， 最 终 数据 报告 随 着 部 门 的 裁撤 而 消失 。 


(5) 数据 监视 
数据 监视 是 对 数据 的 持续 跟踪 和 评估 ， 从 技术 安全 、 运 维 成 本 和 业务 应 用 价值 等 角度 不 断 优化 数据 质量 ， 同 时 为 数据 存档 做 准备 。 
(6) 数据 存档 


数据 存档 是 减少 数据 运 维和 存储 压力 的 重要 方式 ， 也 是 提高 数据 应 用 效率 的 主要 途径 之 一 。 通 常 ， 企 业内 部 数据 的 使 用 频率 随 着 时 间 的 推移 ， 历 史 数 据 的 使 用 频率 逐渐 下 降 。 而 在 大 多 数 场景 中 ， 对 于 
历史 数据 的 应 用 都 只 是 在 汇总 统计 层面 。 


数据 存档 分 为 两 部 分 : 一 是 在 线 存 档 ， 将 访问 频率 较 高 且 应 用 性 较 高 的 数据 从 应 用 中 分 离 出 来 ， 通 过 数据 库 等 形式 保存 ， 在 此 期 间 用 户 可 以 在 线 访问 ; 二 是 离线 归档 ， 对 于 访问 频率 低 且 应 用 性 较 低 的 
数据 以 光盘 等 形式 进行 离线 存储 ， 此 时 用 户 无 法 在 线 访问 ， 只 能 通过 恢复 介质 访问 。 


(7) 数据 销毁 


数据 销毁 是 对 已 经 失去 价值 或 应 用 性 的 数据 进行 销毁 的 过 程 ， 包 括 删 除 、 擦 写 甚至 是 对 物理 介质 的 销毁 ， 这 是 数据 生命 周期 的 结束 。 该 情形 常见 于 业务 调整 或 业务 取消 等 ， 即 失去 数据 所 依赖 的 业务 主 
体 。 


14.5 “本章 小 结 


本 章 主要 围绕 数据 质量 把 控 与 建设 的 相关 内 容 进 行 介绍 ， 需 要 读者 重点 掌握 的 知识 点 如 下 : 

数据 质量 建设 的 内 涵 ， 重 点 是 针对 整个 数据 工作 流程 的 管理 而 不 仅 是 数据 主体 本 身 。 

“ 数据 质量 建设 的 框架 ， 重 点 是 数据 标准 的 制定 和 数据 生命 周期 的 管理 。 在 数据 生命 周期 中 需要 关注 数据 应 用 的 生命 周期 管理 ， 这 是 数据 落地 的 关键 一 环 ， 也 是 产生 价值 的 主要 环节 。 
针对 本 章 内 容 ， 请 读者 思考 以 下 两 个 问题 : 

. 网 站 数据 采集 由 于 各 种 问题 导致 其 准确 性 难以 达到 100%， 如 何 提 高 网 站 数据 的 准确 性 以 及 保证 关键 指标 与 企业 核心 数据 的 一 致 性 ? 

"当前 所 服务 的 企业 是 否 存 在 数据 质量 问题 ? 如 果 有 ， 应 该 如 何 改善 并 提高 企业 的 数据 质量 ? 

由 于 数据 质量 把 控 和 建设 的 内 容 涉及 广泛 ， 限 于 篇 幅 无 法 进行 详细 介绍 ， 在 此 提供 了 以 下 参考 资料 供 读者 自行 学 习 。 


" 《数据 仓库 工具 箱 : 维度 建 模 的 完全 指南 》 一 书 从 维度 结构 建 模 的 知识 入 手 ， 通 过 多 个 行业 实例 介绍 了 数据 仓库 设计 与 开发 的 基本 知识 ， 对 于 数据 工作 者 理解 数据 的 采集 规划 、 存 储 结构 和 后 期 应 用 
有 非常 大 的 帮助 。 


“ 国际 公认 的 OMG 组 织 的 公共 仓库 模型 CWM 是 数据 仓库 和 商业 智能 工具 之 间 共 享 元 数据 的 规范 ， 这 套 标准 主要 从 技术 角度 定义 元 数据 共享 的 标准 ， 感 兴趣 的 读者 可 以 进行 详细 了 解 。 


* 国际 货币 基金 组 织 的 数据 质量 评估 框架 DQAF (Data Quality Assessment Framework) 是 以 联合 国政 府 统 计 基 本 原则 为 根本 构建 的 数据 质量 评估 框架 体系 ， 其 运用 信息 精 理 论 对 数据 质量 进行 评估 ， 其 主 
要 用 于 宏观 数据 质量 的 评估 。 


` 在 数据 挖 据 建 模 的 标准 中 ， 除 了 书 中 提 到 的 CRISP-DM 模 型 外 ， 还 包括 SPSS 提 出 的 5A 模 型 (Assess、Access、Analyze、Act、Automate) 以 及 SAS 提 出 的 SEMMA (Sample、Explore、Modify、Model、 
Assess) ， 读 者 可 自行 查找 相关 资料 进行 学 习 。 


第 12 章 ”数据 投入 与 产 出 管理 


在 激烈 竞争 的 经 济 环境 下 ， 成 本 控制 和 效益 产 出 是 企业 普遍 关注 的 焦点 问题 。 如 何 科学 的 分 析 企 业内 部 数据 主体 的 成 本 构成 及 效益 产 出 并 找到 最 佳 投 入 产 出 关系 是 每 个 数据 管理 者 都 在 思考 的 问题 。 


数据 业务 作为 企业 内 部 的 特殊 主体 在 某 种 程度 上 既是 “裁判 员 ” 又 是 “运动 员 ”， 其 效果 投入 和 产 出 评估 具有 特殊 性 。 本 章 将 从 数据 投入 和 产 出 的 内 涵 入 手 ， 分 别 曾 述 数据 投入 和 产 出 的 特征 ， 并 围绕 
如 何 进行 数据 投入 和 产 出 管理 进行 详细 介绍 。 


15.1 ”数据 投入 与 产 出 的 内 洱 


数据 的 投入 与 产 出 管理 即 数据 的 成 本 与 效益 管理 。 成 本 和 效益 分 析 作 为 一 种 评估 和 决策 方法 ， 将 投入 和 产 出 关系 分 析 运 用 于 企业 的 计划 决策 之 中 ， 以 寻求 在 投资 决策 上 如 何以 最 小 的 成 本 获得 最 大 的 收 


如 


这 是 一 种 量入为出 的 经 营 理念 ， 要 求 对 数据 未 来 业务 行动 有 较为 明确 的 预期 目标 ， 并 对 完成 预期 目标 有 较 大 的 实现 信心 。 但 是 ， 大 多 数 企 业 都 没有 做 数据 投入 和 产 出 管理 ， 这 导致 企业 对 数据 的 预期 目 
标 和 价值 不 明确 、 资 源 协调 不 及 时 甚至 缺乏 资源 支持 ， 数 据 价值 无 法 发 挥 最 大 化 。 


数据 投入 与 产 出 管理 的 基本 前 提 是 企业 追求 数据 价值 最 大 化 。 只 有 存在 较为 明确 的 产 出 预期 ， 数 据 才 能 得 到 企业 的 重视 和 投入 。 良 好 的 数据 投入 和 产 出 管理 能 解答 领导 层 在 决策 时 的 疑虑 : 
“ 数据 投入 需要 多 少 费 用 ? 

: 一 次 性 投入 费用 和 后 期 持续 性 费用 预计 是 多 少 ? 

: 数据 在 什么 时 间 能 产 出 价值 ? 

* 预期 数据 能 产 出 什么 价值 ? 

. 这 些 价值 能 应 用 到 企业 哪些 环节 ， 为 企业 运营 带 来 哪些 提升 ? 


* 运作 起 来 的 数据 业务 是 否 安全 ， 存 在 哪些 数据 风险 问题 ? 


i 未 很 多 时 候 企业 领导 层 不 是 看 不 到 数据 的 价值 ， 而 是 对 数据 的 投入 和 产 出 没有 把 握 ， 因 此 会 抱 着 试 一 试 的 想法 让 数据 部 门 先 运作 起 来 ， 待 数据 产 出 价值 之 后 再 增加 投入 ， 这 是 一 种 常见 的 量 入 为 


出 的 管理 思想 。 


15.2 ”数据 投入 与 产 出 的 特征 


1. 逐 利 性 


任何 商业 类 企业 都 以 营利 为 目的， 任何 管理 和 决策 的 目的 都 是 利润 最 大 化 。 数 据 投入 与 产 出 管理 是 企业 成 本 收益 分 析 的 基本 环节 ， 在 提高 数据 本 身 效益 的 基础 上 促进 企业 其 他 运营 环节 的 业绩 增长 ,其 


至 带 来 新 的 业绩 增长 点 。 
2. 最 优化 
数据 投入 产 出 管理 的 最 佳 状态 是 以 最 小 的 数据 投入 获得 最 大 的 数据 产 出 ， 即 所 谓 的 ROI (投入 产 出 比 ) 最 大 化 。 最 优化 是 企业 经 营 的 理想 状态 。 
3. 复 杂 性 
(1) 数据 风险 的 不 可 避免 性 


数据 投入 和 产 出 管理 自身 带 有 不 可 避免 的 风险 性 ， 不 存在 没有 数据 风险 的 企业 ， 只 是 不 同 的 企业 存在 的 数据 风险 大 小 有 所 差异 而 已 。 一 方面 ， 当 企业 不 做 投入 和 产 出 管理 时 ， 即 使 数据 不 被 公司 的 任何 
业务 部 门 使 用 ， 数 据 也 会 存在 泄漏 、 丢 失 和 人 入 侵 风 险 。 另 一 方面 ， 当 数据 进行 投入 和 产 出 管理 工作 时 ， 可 能 由 于 流程 、 制 度 、 人 员 等 问题 导致 的 数据 安全 风险 或 数据 决策 风险 问题 。 因 此 ， 凡 是 涉及 数据 的 
工作 其 风险 性 毫 无 疑问 都 会 存在 。 


(2) 数据 的 产 出 效果 难以 衡量 


数据 业务 是 依附 于 企业 其 他 业务 而 存在 的 主体 ， 如 果 没 有 业务 部 门 或 上 T 部 门 的 辅助 ， 数 据 无 法 运转 更 不 用 说 单独 发 挥 价值 。 当 对 数据 主体 进行 效果 和 产 出 评估 时 ， 由 于 存在 这 种 依赖 关系 而 无 法 准确 识 
别 效果 提升 的 主要 驱动 因素 ， 尤 其 是 当 业 务 主体 、 内 部 客观 环境 、 外 部 企业 环境 等 客观 因素 发 生变 化 时 ， 更 无 法 进行 效果 评估 。 例 如 : 


.如果 业务 方 在 实施 数据 建议 的 同时 也 在 优化 其 他 因素 ， 那 么 很 难 判 断 到 底 是 业务 的 自身 改善 还 是 数据 建议 带 来 了 效果 提升 。 
如 果 因 为 企业 外 部 因素 如 消费 群体 喜好 的 变更 、 市 场 低迷 等 负面 因素 导致 业务 落地 时 效果 不 明显 甚至 出 现 负面 效 果 ， 很 难 准 确 找 到 原因 主体 。 


i 数据 产 出 效果 的 不 确定 性 及 度量 的 复杂 性 是 影响 领导 层 对 数据 进行 投入 决策 最 主要 的 因素 之 一 。 站 在 企业 领导 层 的 角度 思考 : 如 果 没 有 数据 辅助 决策 ， 企 业 会 损失 多 少 利润 ? 这 个 问题 往往 没 


有 准确 答案 ， 并 且 也 不 可 能 通过 数据 方法 (如 A/B 测 试 ) 得 到 答案 。 
4. 阶 段 性 


当 数 据 没有 达到 一 定 规模 和 数量 时 ， 很 难 通过 数据 规律 的 挖 所 来 大 幅度 提升 业务 效果 ， 主 要 原因 是 数据 量 不 足以 达到 提炼 规律 的 标准 。 只 有 当 数 据 规模 较 大 时 ， 才 存在 提炼 出 规律 和 知识 的 可 能 性 。 换 
句 话说 ， 当 企业 较 小 时 ,数据 可 以 发 挥 价 值 的 场景 以 及 产 出 效果 不 明显 ; 当 企 业 具 备 一 定 规模 上 时， 数据 才 有 更 好 的 环境 发 挥 其 价值 。 因 此 ， 数 据 的 作用 大 多 情况 下 是 锦 山 添 花 ， 而 非 雪 中 送 炭 。 


ia 在 企业 成 长 初期 ， 数 据 部 门 或 相关 职位 通常 不 是 必需 的 。 即 使 在 没有 数据 支持 的 情况 下 ， 如 果 企 业 具 备 其 他 核心 竞争 力 (如 产品 或 服务 ) 也 会 迅速 做 大 。 这 说 明了 数据 不 是 必须 存在 的 主体 ， 
最 起 码 在 企业 创建 初期 不 是 ， 只 有 企业 在 其 他 方面 较为 完善 之 后 才 会 考虑 数据 问题 。 这 时 数据 投入 与 产 出 评估 的 必要 性 才 会 显现 出 来 。 


15.3 数据 投入 与 产 出 的 管理 


15.3.1 ”数据 投入 管理 


1 数据 投入 的 组 成 
数据 投入 指 开展 数据 工作 需要 的 投入 ， 包 括 固 定投 入 费用 、 运 营 维 护 费 用 、 时 间 成 本 、 风 险 成 本 、 机 会 成 本 以 及 数据 获取 成 本 。 
(1) 固定 投入 费用 

固定 投入 费用 指 开展 数据 工作 初期 需要 投入 的 费用 ， 通 常 是 一 次 性 固定 费用 ， 例 如 : 

. 土地 取得 费用 。 自 建 数据 中 心 时 通常 需要 有 自己 的 土地 ， 因 此 会 存在 土地 买卖 或 租赁 费用 。 

“ 机 房 建设 费用 。 自 建 数据 中 心机 房 的 费用 ， 属 于 工程 性 的 投入 。 

. 设备 购置 费用 。 数 据 中 心 正常 工作 所 需 的 服务 器 、 交 换 机 、 空 调 、UPS、 备 用 发 电机 等 设备 的 采购 费用 。 

. 基础 设施 费用 。 数 据 中 心 内 的 道路 、 场 地 、 供 水 、 供 电 、 供 气 、 通 信 、 排 污 、 照 明 等 费用 。 

. 系统 和 软件 授权 费用 。 数 据 处 理 时 所 需要 的 各 种 系统 和 软件 的 授权 费用 ， 其 中 可 能 包含 直接 买 断 的 费用 投入 ， 如 按 license 方 式 购买 的 软件 。 
(2) 运营 维护 费用 

运营 维护 费用 指 为 了 保证 数据 工作 正常 开展 所 需 的 日 常 费用 。 

: 日常 运 维 费 用 : 包括 水 、 电 、 气 、 通 信 、 网 络 的 维修 、 监 测 、 保 险 等 费用 。 

机 房租 赁 成 本 : 租赁 第 三 方 机 房 以 及 维护 成 本 ， 购 买 虚拟 主机 或 云 服 务 的 项 目 还 存在 服务 租赁 费用 。 

. 系统 和 软件 的 授权 费用 : 按照 时 间 、 规 模 、 设 备 数 等 购买 的 年 度 或 季节 性 费用 。 

人 力 成 本 : 开展 数据 工作 所 需要 的 技术 开发 、 产 品 设计 、 分 析 师 、 工 程 师 等 人 员 成 本 。 


(3) 时 间 成 本 


时 间 成 本 作为 隐 性 成 本 通常 被 大 多 数 企 业 忽视 ， 但 实际 上 数据 工作 中 如 果 投 入 管理 不 当 ， 会 导致 大 量 时 间 消 耗 在 不 必要 的 环节 。 例 如 ， 复 杂 的 数据 清洗 、 内 部 无 效 沟通 、 重 复 项 目 建 设 等 ， 而 对 于 真正 
产 出 价值 的 数据 挖掘 上 的 投入 不 足 。 


(4) 风险 成 本 


风险 成 本 包括 数据 泄露 风险 及 数据 应 用 风险 可 能 带 来 的 企业 损失 。 数 据 泄露 意味 着 第 三 方 可 能 利用 企业 自身 数据 开展 有 针对 性 的 经 营 措施 ， 而 数据 应 用 风险 将 可 能 带 来 数据 决策 失误 ， 这 两 种 风险 都 可 
能 对 企业 形成 难以 估量 的 损失 。 


(5) 机 会 成 本 


机 会 成 本 指 决策 过 程 中 面临 多 个 选择 时 ， 放 弃 的 可 能 产 出 最 大 价值 的 选择 ， 也 叫做 “ 著 代 性 成 本 ”， 通 俗 的 理解 就 是 “有 得 必 有 失 ”。 机 会 成 本 对 于 数据 投入 与 产 出 管理 的 意义 在 于 : 当 企业 集中 大 量 
资源 到 数据 主体 时 ， 如 果 把 这 些 资源 聚焦 到 产品 研发 、 服 务 提升 、 流 程 规范 上 可 能 带 来 更 高 的 企业 效益 。 因 此 ， 存 在 投资 到 企业 其 他 业务 主体 上 产生 更 大 价值 回报 的 可 能 性 。 同 样 ， 当 数据 部 门面 对 多 个 项 
目 工作 时 ， 在 资源 有 限 的 情况 下 需要 选择 投入 和 产 出 效果 最 好 的 项 目 。 


(6) 数据 获取 成 本 


数据 按照 来 源 可 分 为 企业 采集 、 数 据 购买 、 数 据 交 换 以 及 其 他 途径 ， 在 这 些 来 源 中 ， 数 据 购买 需要 直接 投入 成 本 ， 而 数据 交换 也 是 通过 数据 作为 等 价 物 换取 的 一 种 方式 ， 这 些 都 是 数据 获取 成 本 的 体 


2. 数 据 投 入 的 评估 

数据 投入 的 评估 最 重要 的 三 个 指标 是 : 总 成 本 、 平 均 成 本 以 及 边际 成 本 。 
(1) 总 成 本 

总 成 本 是 所 有 成 本 之 和 ， 计 算 公 式 为 : 

总 成 本 = 国定 投入 费用 + 运营 维护 费用 + 数据 获取 成 本 + 其 他 成 本 


在 成 本 计算 中 ， 隐 性 成 本 如 时 间 成 本 、 风 险 成 本 、 机 会 成 本 等 无 法 具体 量化 ， 因 为 无 法 体现 在 计算 公式 中 ， 这 部 分 可 通过 文字 的 形式 进行 定义 描述 ， 也 可 结合 现 有 数据 价值 进行 适当 的 定量 评估 。 另 
外 ， 企 业内 部 成 本 主体 之 间 的 变更 (费用 摊派 到 哪个 部 门 ) 也 会 影响 数据 总 成 本 。 


(2) 平均 成 本 
平均 成 本 根据 不 同 的 平均 主体 可 延伸 出 不 同 的 指标 ， 例 如 平均 用 工 成 本 。 平 均 成 本 是 衡量 每 个 单位 投入 的 重要 指标 。 


ta 做 企业 数据 成 本 评估 时 ， 通 常 对 于 长 期 使 用 的 经 营 性 资产 按照 其 使 用 年 限 每 年 分 挫 购 置 成 本 的 会 计 处 理 办 法 。 例 如 ， 企 业 购 置 了 价值 5000000 元 的 数据 工具 ， 如 果 按 照 10 年 进行 挫 销 ， 每 年 摊 
销 成 本 为 500000 元 。 这 500000 元 将 在 不 同年 限 对 相应 部 门 做 成 本 核算 时 单独 计算 ,而 不 是 在 购买 初期 就 将 全 部 成 本 纳入 成 本 计算 范畴 。 摊 销 常见 于 土地 使 用 权 、 大 型 软件 、 开 办 费 等 无 形 资产 ， 而 对 于 固定 
资产 则 采用 折旧 的 处 理 方法 。 


(3) 边际 成 本 


在 经 济 学 和 人 金融 学 中 ， 边 际 成 本 指 每 新 增 一 个 单位 产品 (生产 或 销售 产品 ) 带 来 的 总 成 本 的 增 量 。 在 衡量 数据 主体 的 过 程 中 ， 定 义 为 每 新 增 一 个 单位 产品 (生产 或 销售 产品 ) 带 来 的 数据 总 成 本 的 增 


众所周知 ， 数 据 工作 在 前 期 需要 投入 一 定 的 固定 费用 而 导致 数据 单位 成 本 较 高 ， 如 图 15-1 所 示 的 阶段 一 ; 随 着 业务 数据 量 的 增加 以 及 数据 规模 化 效应 的 显现 ， 每 增加 一 次 销售 所 需要 的 单位 数据 成 本 会 
逐渐 降低 并 达到 相对 稳定 的 水 平 ， 如 图 15-1 所 示 的 阶段 二 


, 


下 成 才 


是 
二 


边 


时 间 


图 15-1 ”数据 边际 成 本 变化 


15.3.2 ”数据 产 出 管理 


1 数据 产 出 的 组 成 


数据 产 出 指数 据 最 终 对 企业 利润 和 价值 的 贡献 ， 而 不 是 数据 报表 、 产 品 、 模 型 或 报告 。 数 据 产 出 主要 包括 业务 价值 的 提升 及 数据 现金 流 做 出 的 贡献 。 
(1) 业务 价值 提升 
数据 产 出 的 最 初 预 期 是 通过 数据 对 业务 运营 效果 提升 起 到 作用 ， 常 见 的 价值 产 出 场景 包括 : 

* 降低 营销 成 本 并 提高 营销 ROI; 

提高 站 内 用 户 体验 并 最 终 提高 用 户 订 单 转化 率 ; 

“ 增加 客户 黏 性 并 提高 客户 重复 购买 率 ，; 

* 降低 库存 积压 率 并 减少 资金 占用 ， 以 提高 库存 周转 率 。 
业务 价值 提升 是 辅助 决策 的 主要 目标 ， 需 要 借助 业务 部 门 落地 动作 才能 实现 价值 ， 通 过 数据 优化 前 和 优化 后 的 效果 对 比 来 评估 提升 效果 。 
(2) 数据 现金 流 贡 献 
数据 现金 流 贡 献 指 直接 通过 数据 带 来 的 新 业务 模式 或 新 的 销售 增长 点 ， 例 如 : 

通过 数据 发 现 了 新 的 广告 位 ， 从 而 带 来 新 的 广告 售卖 利润 点 ; 

` 通过 对 用 户 行为 的 精准 匹配 ， 在 网 站 内 部 开发 出 个 性 化 推荐 系统 ， 通 过 对 内 部 商家 开放 并 获取 佣金 、 返 点 、 服 务 费 等 形式 增加 企业 收入 ; 


通过 用 户 需求 分 析 发 现 了 新 的 市 场 方向 ， 并 通过 新 模式 的 开拓 增加 企业 收入 来 源 ; 


上 


些 情况 下 ， 数 据 还 可 以 作为 一 项 单独 的 业务 体 变 现 。 例 如 ， 直 接 售卖 数据 或 通过 自 有 数据 为 第 三 方 数据 提供 清洗 和 校 验 等 服务 。 


数据 现金 流 直 接 将 数据 作为 业务 主体 ， 通 过 IT 系统 或 工具 的 辅助 支撑 实现 利润 提升 ; 在 为 业务 部 门 提供 新 的 业务 模式 时 ， 也 可 以 直接 带 来 业务 从 无 到 有 的 价值 增长 。 数 据 现金 流 贡献 必须 基于 数据 驱动 
的 机 制 才能 实现 ， 关 于 数据 驱动 具体 内 容 请 见 第 1 章 1.4 “辅助 决 策 与 数据 驱动 的 争议 ”。 


@ia 示 数据 作为 企业 的 核心 资产 之 一 正 被 越 来 越 多 的 企业 关注 ， 未 来 数据 的 质量 、 数 据 完整 度 、 数 据 量 级 、 数 据 类 型 多 样 性 、 数 据 新 鲜 度 等 都 可 能 被 标准 化 并 成 为 企业 资产 负债 表 中 的 重要 项 目 ， 这 
是 数据 作为 隐 性 资产 的 重要 特性 。 


2. 数 据 产 出 的 评 佑 
作为 领导 层 天 心 的 数据 产 出 是 对 企业 利润 的 直接 贡献 ， 该 贡献 可 以 反映 到 企业 财务 报表 中 。 数 据 投入 的 评估 最 重要 的 是 三 个 指标 : 总 利润 、 平 均 利润 以 及 边际 利润 。 


(1) 总 利润 
总 利润 是 所 有 直接 利润 和 间接 利润 之 和 ， 计 算 公 式 为 : 
利润 = 直接 利润 + 间接 利润 
间接 利润 即 业务 提升 价值 ， 计 算 公式 为 : 
间接 利润 = 数据 优化 后 产 出 - 数据 优化 前 产 出 
直接 利润 即 数据 现金 流 ， 直 接 通过 数据 产 出 而 非 业 务 建 议 或 动作 产 出 的 利润 贡献 。 
(2) 平均 利润 
平均 利润 根据 不 同 的 平均 主体 有 不 同 的 指标 ， 例 如 人 均 利润 等 。 
(3) 边际 利润 


在 经 济 学 中 ， 边 际 利润 或 边际 收益 指 每 新 增 一 个 单位 产品 (生产 或 销售 产品 ) 带 来 的 总 利润 或 收益 的 增 量 。 在 衡量 数据 主体 的 过 程 中 ， 该 定义 为 每 新 增 一 个 单位 产品 (生产 或 销售 产品 ) 带 来 的 数据 总 
利润 的 增 量 


如 图 15-2 所 示 为 数据 边际 利润 变化 趋势 图 : 阶段 一 ， 企 业 数 据 发 展 初期 ， 边 际 利润 随 着 数据 工作 规模 的 扩大 而 逐渐 上 升 并 体现 出 规模 效应 ;阶段 二 ， 在 企业 发 展 到 一 定 规模 时 ， 数 据 部 门 的 边际 利润 出 
现 瓶 贷 ， 即 使 增加 更 多 的 业务 资源 也 无 法 获得 更 高 的 边际 利润 ;阶段 三 ， 当 企业 规模 非常 大 时 ， 如 果 不 控制 数据 资源 的 投入 ,会 由 于 资源 浪费 、 人 浮 于 事 等 原因 导致 边际 利润 的 下 降 。 


习 


乐 和 


i 


[路段 二 


一 
时 间 
图 15-2 ”数据 边际 利润 变化 趋势 图 


15.3.3 数据 投入 与 产 出 优化 


数据 投入 与 产 出 优化 不 仅仅 是 单纯 的 压缩 成 本 和 费用 ， 它 需要 结合 企业 战略 目标 、 经 莒 方向 、 经 营 模式 等 建立 科学 合理 的 成 本 分 析 与 产 出 评估 体系 ， 应 从 投入 和 产 出 两 方面 入 手 进 行 控制 。 


作为 数据 管理 者 的 主要 工作 已 经 不 是 凡事 身体 力行 、 事 必 身 亲 ， 而 是 要 有 效 的 领导 和 管理 他 人 做 事 。 数 据 投 入 与 产 出 优化 ， 主 要 从 数据 项 目 管理 (管事 ) 、 数 据 人 员 管 理 ( 管 人 ) 和 数据 流程 管理 ( 管 
流程 ) 三 方面 入 手 。 


1. 数 据 项 目 管理 


数据 项 目 是 在 一 定 条件 及 限定 资源 下 需要 完成 的 任务 。 数 据 类 项 目 根据 难 易 程度 、 完 成 周期 、 涉 及 范围 等 区 别 较 大 ， 大 型 数据 项 目 可 能 包括 数据 仓库 建设 、BI 产 品 开发 、 站 内 个 性 化 系统 开发 等 ， 小 型 
数据 项 目 可 能 是 一 个 数据 分 析 报 告 、 一 次 数据 挖掘 模型 、 一 次 调研 报告 等 。 


项 目 管理 的 本 质 是 确定 要 做 什么 、 做 到 什么 程度 、 什 么 时 候 做 、 谁 来 做 、 如 何 做 等 。 数 据 项 目 管理 的 五 要 素 为 : 范围 管理 、 时 间 管 理 、 成 本 管理 、 质 量 管理 和 风险 管理 。 
(1) 范围 管理 
范围 管理 是 对 数据 工作 涉及 的 内 容 、 程 度 及 产 出 的 定义 ， 其 包括 以 下 两 层 含义 : 


: 定义 工作 产 出 目标 ， 即 如 何 衡量 项 目 工 作 已 经 完成 。 如 交付 客户 流失 模型 、 交 付 市 场 调 研 报告 、 交 付 报 表 系 统 或 者 站 内 推荐 系统 上 线 。 工 作 产 出 目标 的 明确 定义 可 以 保证 项 目 工作 者 准确 掌握 项 目的 
结束 状态 ， 并 能 减少 人 额外 资源 投入 导致 的 浪费 以 及 带 来 的 负面 影响 ， 如 项 目 无 法 正常 交付 、 影 响 其 他 项 目 正常 开展 等 。 


“ 定义 工作 需求 条 件 ， 即 要 完成 该 项 目 需要 哪些 条 件 和 资源 的 支持 ， 主 要 包括 数据 范围 和 人 员 范 围 。 数 据 范围 包括 数据 主题 、 数 据 类 型 、 数 据 格式 、 抽 取 条 件 、 时 间 范 围 、 数 据 粒 度 等 ; 人 员 范 围 指 哪 


些 人 参与 才能 实现 项 目 需求 。 
(2) 时 间 管 理 
时 间 管 理 是 为 了 确保 按照 项 目 预定 时 间 完 成 的 一 系列 管理 过 程 ， 它 包括 活动 排序 、 时 间 估 计 、 进 度 安排 及 时 间 控 制 等 项 工作 。 
时 间 管 理 通常 使 用 项 目 进度 表 来 描述 ， 进 度 表 不 仅 能 说 明 完 成 项 目 工作 所 需 的 时 间 ， 也 规定 了 每 个 活动 的 具体 开始 和 完成 日 期 ， 甚 至 可 以 对 每 个 活动 的 主要 内 容 及 预期 目标 进行 简单 定义 。 图 15-3 所 示 


为 一 个 简单 的 产品 项 目 时 间 进 度 表 。 


3013 9 


一 国 贺 区 国 区 国 回国 国 国 国 切 


国 需求 分 析 “| 2014/9/8 星期 一 | 2014/978 星期 一 
加 需求 策划 2014/9y/9 星期 二 | 2014/9/10 星期 三 


国 产品 测试 2014/9/716 足 期 二 201479718 早期 四 


产品 上 线 2014/9/19 星期 五 | 2014/9/19 星期 五 


图 15-3 ”产品 项 目 时 间 进 度 表 
(3) 成 本 管理 


成 本 管理 是 项 目 管理 的 重要 内 容 ， 每 个 项 目 工作 必须 在 既定 的 预算 内 完成 。 通 常 成 本 指 的 是 显 性 成 本 ， 例 如 咨询 费用 、 系 统购 买 费 用 、 培 训 | 费用、 设备 资金 等 。 在 某 些 情况 下 也 可 以 评估 隐 性 成 本 因 


素 ， 尤 其 是 对 项 目 完成 影响 较 大 的 客观 因素 及 不 可 量化 因素 。 在 范围 管理 中 主要 体现 产 出 什么 ， 而 在 成 本 管理 中 主要 体现 投入 什么 ， 通 过 范围 管理 和 成 本 管理 形成 两 端的 约束 ， 配 合 其 他 管理 要 素 共同 实现 


(4) 质量 管理 


质量 管理 是 为 了 确保 项 目 达 到 预定 目标 对 质量 进行 要 求 和 规范 的 管理 过 程 ， 包 括 : 质量 规划 、 质 量 控制 和 质量 标准 等 。 质 量 管 理 对 于 工程 类 和 |T 类 项 目 较 为 容易 量化 ， 例 如 ， 数 据 仓库 建设 项 目 可 通过 
数据 延迟 性 、 数 据 完整 度 、ETL 时 间 、 数 据 仓库 性 能 测试 等 进行 管理 。 但 是 对 于 业务 类 项 目 ， 例 如 报告 、 模 型 等 很 难 使 用 标准 化 的 指标 进行 衡量 ， 对 于 这 类 项 目 通 常 通过 两 方面 进行 质量 管理 : 一 是 过 程 管 
理 ， 通 过 对 过 程 的 规范 来 保证 过 程 实施 的 标准 化 和 规范 化 ， 二 是 结果 管理 ， 通 过 对 项 目 结 果 的 基本 结构 、 模 块 、 撰 写 标 准 、 用 户 理解 性 、 用 户 满意 度 甚 至 对 业务 直接 驱动 产生 的 价值 进行 评估 。 


(5) 风险 管理 


数据 类 项 目 与 其 他 项 目 管理 不 同 点 在 于 其 风险 管理 要 求 较 高 ， 这 一 方面 体现 在 数据 安全 性 对 于 企业 战略 安全 的 意义 ， 另 一 方面 也 体现 在 数据 应 用 风险 和 决策 失误 风险 管理 的 必要 性 。 关 于 数据 风险 的 相 
关 知 识 ， 请 见 第 13 章 “数据 风险 管理 与 控制 ”。 


2. 数 据 人 员 管 理 

数据 人 员 管 理 包括 目标 管理 、 成 长 管理 和 绩效 管理 。 

(1) 目标 管理 

目标 管理 分 为 以 下 三 个 层次 : 

. 价值 认同 感 。 团 队 成 员 必须 认同 企业 和 数据 部 门 的 文化 及 价值 观 ， 不 能 认同 文化 和 价值 观 的 员工 不 仅 自身 无 法 带 来 价值 还 会 带 坏 团队 的 风气 并 影响 绩效 产 出 。 
:为 现在 而 工作 。 每 个 团队 成 员 都 必须 了 解 自己 工作 岗位 的 基本 职责 、 内 容 和 基本 产 出 ， 这 是 保证 现 有 工作 正常 进行 并 实现 既定 目标 产 出 的 基础 。 

. 为 未 来 而 工作 。 为 每 个 团队 成 员 设 计 未 来 发 展 方向 和 职业 前 景 ， 驱 动 团队 成 员 发 挥 超出 预期 的 工作 能 量 并 带 来 更 好 的 工作 产 出 。 

(2) 成 长 管理 

团队 成 长 是 管理 者 必须 重视 的 课题 ， 一 个 没有 成 长 的 团队 一 定 会 被 企业 和 社会 淘汰 。 企 业内 部 的 团队 成 长 主要 通过 以 下 两 条 路 径 : 


: 一 是 团队 自我 成 长 。 在 这 个 过 程 中 需要 管理 者 提供 尽量 多 的 工作 场景 和 实践 机 会 ， 同 时 能 够 信任 团队 并 适度 放权 ， 在 工作 方向 正确 的 前 提 下 允许 一 定 程度 的 犯错 。 除 此 之 外 ， 适 时 地 引入 新 的 血液 ， 
新 方法 、 新 思路 和 新 见解 对 团队 激励 有 好 处 ， 铃 鱼 效 应 会 让 团队 更 有 动力 。 


“ 二 是 部 门 内 部 培训 。 数 据 部 门 需要 根据 工作 重点 、 内 容 和 目标 建立 内 部 培训 计划 ， 针 对 内 部 数据 工作 人 员 进 行 培训 ， 内 容 包 括 业 务 类 知识 、 数 据 类 知识 、 工 具 类 知识 及 流程 类 知识 ， 这 些 知 识 可 以 避 
免 团 队 走 索 路 ， 并 提高 工作 绩效 。 


(3) 绩效 管理 


绩效 管理 是 驱动 人 员 产 出 的 制度 保障 ， 目 的 是 持续 提升 个 人 、 部 门 和 组 织 的 绩效 产 出 。 绩 效 管理 并 不 只 是 绩效 考核 ， 而 是 包括 管理 者 和 员工 为 了 达到 目标 而 共同 参与 的 绩效 制定 、 绩 效 沟通 、 绩 效 考 核 
和 绩效 反馈 的 循环 过 程 。 


“ 绩效 制定 : 根据 企业 和 部 门 的 目标 制定 绩效 指标 ， 兼 具 业 绩 、 态 度 和 能 力 三 方面 。 

* 绩效 沟通 : 绩效 标准 与 团队 成 员 的 沟通 ， 保 证 团队 成 员 准 确 理解 目标 内 容 并 为 之 努力 。 

* 绩效 考核 : 定期 评估 团队 成 员 的 实际 表现 ， 并 得 出 考核 结果 。 

* 绩效 反馈 : 与 团队 成 员 沟 通 考核 结果 并 明确 改进 方向 。 
@ia 示 绩效 管理 并 不 等 于 扣 钱 ， 也 不 是 无 条 件 的 升 职 加 薪 ， 而 是 根据 评估 结果 驱动 成 长 或 优胜 劣 汰 。 作 为 数据 部 门 的 领导 ， 维 护 并 扩大 团队 的 工作 资源 和 团队 成 员 的 利益 是 其 基本 职责 之 一 。 
3. 数 据 流程 管理 


数据 流程 管理 指 的 是 流程 分 析 、 流 程 定义 、 资 源 分 配 、 时 间 安 排 、 流 程 质量 、 流 程 参 与 及 规范 、 流 程 优 化 的 过 程 。 常 见 的 数据 流程 包括 需求 处 理 流程 、 数 据 产品 开发 流程 、 项 目 工作 流程 、 数 据 落 地 流 
程 、 数 据 培训 流程 等 。 有 关 数 据 流程 的 具体 内 容 会 在 第 16 章 “数据 流程 与 落地 管理 ”中 具体 讲解 。 


15.4 ”本章 小 结 


本 章 主要 围绕 数据 投入 与 产 出 的 相关 内 容 进行 介绍 ， 需 要 读者 重点 掌握 的 知识 点 如 下 : 

* 数据 投入 与 产 出 的 内 涵 ， 重 点 是 对 数据 投入 与 产 出 评估 重要 性 的 理解 。 

* 数据 投入 与 产 出 的 基本 评估 指标 ， 成 本 和 利润 是 企业 最 关注 的 两 类 结果 指标 。 

会 计 学 和 项 目 管理 是 商业 管理 教育 如 EMBA、MBA 等 的 基本 课程 内 容 ， 同 时 也 是 职业 成 长 的 必要 知识 ， 感 兴趣 的 读者 可 通过 以 下 内 容 拓展 相关 知识 : 


“ 财务 数据 是 企业 核算 的 唯一 标准 ， 对 于 书 中 提 到 的 折旧 与 挫 销 以 及 其 他 财务 计算 方法 和 术语 等 ， 非 会 计 学 专业 的 读者 请 阅读 《初级 会 计 学 》 (中 国人 民 大 学 会 计 系 列 教材 . 第 六 版 ，2012 年 6 月 1 日 出 
版 ) 。 


. 项 目 管理 PMP 考 生 和 项 目 管理 从 业 人 员 可 参考 的 专业 书籍 是 《项 目 管理 知识 体系 指南 一 一 PMBOK 指 南 (第 5 版 ) 》， 作 为 入 门 或 了 解 之 用 的 读者 则 可 阅读 《不 懂 项 目 管理 ， 还 敢 拼 职场 》 一 书 。 


第 16 草 ”数据 流程 与 党 地 管理 


随 着 公司 规模 的 扩大 ， 企 业内 部 的 数据 工作 将 逐渐 由 “人 治 ” 走 向 “法 治 ”， 即 工作 流程 需要 通过 完善 的 流程 约束 来 实现 。 建 立 高 效 的 数据 工作 流程 管理 机 制 是 企业 标准 化 、 规 范 化 运营 的 要 求 ， 同 时 


也 是 降低 数据 风险 、 提 升 数据 工作 效果 的 保障 。 


本 章 将 从 数据 流程 与 落地 管理 的 内 涵 切 入 ， 简 单 的 介绍 其 基本 内 容 和 意义 ， 最 后 会 用 大 篇 幅 介绍 数据 流程 与 落地 管理 的 策略 及 框架 。 


16.1 ”数据 流程 与 落地 管理 的 内 涵 


数据 流程 与 落地 管理 通过 对 数据 工作 中 涉及 的 非 技 术 环 节 的 规范 化 管理 ， 以 提高 数据 工作 绩效 为 目的 ， 包 括 流 程 定义 、 规 范 梳理 、 工 作 评估 、 资 源 分 配 、 体 系 测评 及 效果 优化 等 方面 。 
@ia 示 对 于 技术 工作 流程 和 机 制 管 理 请 查阅 本 书 第 14 章 的 内 容 。 

数据 流程 与 落地 管理 的 内 容 包括 数据 需求 管理 、 项 目 工作 流程 管理 、 数 据 培 训 体 系 、 权 限 管理 流程 及 数据 知识 管理 等 内 容 .。 

数据 流程 与 落地 管理 具有 以 下 特点 : 

` 面向 业务 的 管理 机 制 。 数 据 流程 与 落地 管理 的 对 象 是 业务 类 部 门 ， 即 需求 提出 和 落地 对 接 部 门 。 

“ 目的 是 提高 绩效 考核 。 数 据 流程 与 落地 管理 通过 对 流程 和 框架 的 规范 ， 使 得 数据 工作 有 规 可 依 ， 保 证 数据 各 个 环节 的 高 效 流转 和 质量 产 出 。 

自动 化 和 规范 化 。 数 据 流程 与 落地 管理 的 重要 保证 是 自动 化 和 规范 化 的 机 制 ， 无 须 通 过 人 工 过 多 干预 即 可 按照 预定 规则 正常 开展 工作 。 

当 企业 没有 完善 的 数据 流程 与 落地 管理 机 制 时 ， 经 常会 遇 到 以 下 问题 : 

. 数据 部 门将 大 量 的 时 间 用 在 满足 日 常 业务 数据 的 需求 上 ， 而 对 于 深入 挖 据 工 作 投入 不 足 。 

" 数据 工作 人 员 不 了 解 工作 流程 ， 各 项 工作 无 法 顺利 开展 。 


“ 数据 工作 过 程 中 ， 很 多 环节 是 宛 余 且 不 必要 的 ， 但 这 些 工作 却 浪费 了 大 量 时 间 。 


* 数据 部 门 内 部 各 自 为 政 ， 缺乏 统一 的 协同 工作 机 制 。 
. 业务 人 员 缺 乏 必要 的 数据 知识 普及 ， 与 数据 部 门 配合 难度 大 。 
” 当 数 据 部 门 关键 人 员 高 职 时 ， 数 据 工作 无 法 正常 开展 甚至 几 近 瘫 疾 。 


. 数据 权限 管理 混乱 ， 数 据 存 在 较 大 的 泄露 风险 。 


16.2 ”数据 流程 与 落地 管理 的 意义 


当 企业 发 展 到 一 定 阶段 之 后 ， 数 据 部 门 负责 人 直接 参与 所 有 的 数据 工作 难以 为 继 ， 此 时 需要 建立 并 完善 数据 流程 与 落地 管理 机 制 ， 它 具有 以 下 重要 意义 。 
1. 大 型 部 门 正 常 工作 的 基础 


当 部 门 发 展 壮大 后 ， 数 据 部 门 领 导 者 无 法 事 必 躬 亲 。 如 果 具 备 完善 的 数据 流程 和 落地 机 制 ， 各 条 数据 工作 线 按照 规范 实施 即 可 保证 数据 工作 正常 开展 。 日 常数 据 工作 可 通过 流程 和 制度 进行 管理 ， 数 据 
部 门 负责 人 才 会 有 更 多 的 时 间 和 精力 来 思考 部 门 发 展 、 数 据 架构 完善 、 数 据 效果 提升 等 。 


2. 建 立 知识 型 企业 的 必 经 之 路 


数据 工作 是 企业 内 最 具 知 识 合 量 的 分 工 之 一 ， 通 过 规范 流程 将 已 有 知识 进行 补充 和 完善 ， 这 是 一 个 知识 沉淀 的 过 程 。 当 知识 储藏 到 达 一 定 的 阶段 之 后 ， 这 些 知识 就 会 具备 由 量变 到 质变 的 可 能 性 ， 从 而 
创造 出 新 的 知识 为 企业 所 用 ， 这 是 企业 的 宝贵 资产 和 重要 财富 。 


3. 降 低 人 员 流失 产生 的 工作 风险 


数据 工作 是 一 个 知识 与 实践 结合 性 非常 强 的 工作 ， 具 有 丰富 实践 经 验 的 分 析 师 是 数据 高 效 运转 的 重要 基石 。 如 果 这 些 经 验 丰富 的 数据 分 析 师 流失 ， 随 之 而 流失 的 还 有 其 宝贵 经 验 。 完 善 的 数据 流程 和 落 
地 管理 可 以 将 数据 分 析 师 的 宝贵 经 验 固定 化 到 数据 工作 的 每 个 环节 ， 这 使 得 数据 工作 将 大 大 减少 对 个 人 的 依赖 。 换 名 话说， 完善 的 机 制 下 每 个 进入 流程 的 人 员 只 要 按照 制度 工作 都 可 以 出 色 地 完成 任务 。 


4. 数 据 工作 监管 的 基本 途径 


数据 流程 和 落地 管理 定义 了 所 有 数据 工作 流程 ， 每 个 进入 数据 工作 流程 中 的 部 门 和 个 人 在 流程 中 所 扮演 的 角色 、 工 作 的 进度 和 工作 的 结果 产 出 都 能 做 到 实时 监控 ,这 对 于 大 型 数据 项 目的 工作 进度 把 控 
具有 重要 意义 。 另 外 ， 全 流程 的 监控 还 有 助 于 降低 数据 泄露 的 风险 。 


5. 提 高 数据 工作 绩效 的 重要 保障 


数据 流程 和 落地 管理 所 建立 的 工作 标准 是 一 套 自动 化 、 规 范 化 、 流 程 化 的 工作 模式 ， 这 使 得 每 个 参与 者 对 工作 步骤 、 状 态 、 质 量 、 标 准 等 都 有 明确 的 认 知 ， 节 省 


了 沟通 这 些 间 题 而 产生 的 时 间 并 可 以 提 
高 沟通 效率 ， 这 对 于 跨 部 门 、 跨 系统 、 多 用 户 的 工作 尤为 重要 。 另 外 ， 标 准 化 的 工作 机 制 通 过 高 效率 的 管理 工作 以 及 标准 化 的 工作 流程 ， 在 提高 工作 绩效 的 同时 还 能 降低 甚至 


降低 甚至 防范 已 知 错误 的 发 生 概 率 。 


16.3 ”数据 流程 与 落地 管理 的 策略 


数据 流程 与 落地 管理 的 策略 包括 阶段 策略 、 推 动 策 略 、 对 象 策略 、 迭 代 策 略 和 时 机 策略 。 
1. 阶 段 策略 
阶段 策略 用 来 解决 在 什么 阶段 推进 数据 流程 与 落地 管理 机 制 。 


当 企业 或 数据 部 门 出 于 发 展 初期 时 ， 数 据 需求 及 工作 场景 简单 ， 数 据 工作 的 参与 者 较 少 ， 因 此 不 需要 过 多 流程 和 机 制 的 约束 ， 此 时 通过 人 工 管理 的 方式 工作 效率 更 高 。 这 是 由 于 数据 部 门 的 人 数 少 且 对 
接 的 业务 部 门 少 、 需 求 量 也 不 大 ， 人 工 管理 的 方式 更 灵活 。 


但 当 企业 或 数据 部 门 发 展 壮大 时 ， 数 据 部 门 的 工作 人 员 增 加 、 数 据 对 接 部 门 的 数量 也 随 之 增加 ， 更 重要 的 是 数据 需求 以 及 工作 场景 的 复杂 度 提高 ， 单 纯 依 靠 人 工 管理 的 方式 已 经 不 能 高 效率 的 保证 数据 
工作 的 正常 开展 ， 此 时 需要 建立 并 开始 推进 数据 流程 与 落地 管理 机 制 。 


ia 对 于 企业 或 数据 部 门 发 展 阶段 的 判定 并 没有 明确 的 标准 ， 有 具体 可 根据 企业 的 实际 情况 判断 。 通 常 而 言 ， 当 数据 部 门 的 人 数 在 5 人 以 内 以 及 面向 的 业务 部 门 在 3 个 以 内 时 ， 无 须 建 立 过 于 复杂 的 数 
据 流 程 与 落地 管理 机 制 ， 但 可 以 开始 考虑 并 着 手 准 备 ; 而 当 数 据 部 门 的 人 数 超过 10 人 或 面向 的 业务 部 门 超过 5 个 时 ， 就 需要 开始 落地 推进 。 

2. 推 动 策略 

推动 策略 解决 的 问题 是 应 该 如 何 推动 数据 流程 与 落地 管理 机 制 的 实现 。 

不 同 企业 内 部 数据 部 门 所 处 的 地 位 有 所 不 同 ， 推 动 数据 流程 与 落地 管理 机 制 的 实现 有 以 下 两 种 方式 。 

(1) 自 下 而 上 的 推动 

在 企业 领导 层 尚 未 真正 落地 数据 的 战略 地 位 之 前 ， 大 多 数 企业 的 数据 部 门 采取 的 都 是 自 下 而 上 的 推动 策略 。 这 种 策略 的 意义 在 于 通过 对 底层 和 中 层 人 员 数 据 意识 和 数据 文化 的 渗透 ， 慢 慢 推动 业务 层面 
认可 并 落实 数据 工作 文化 ， 最 后 通过 底层 各 个 部 门 的 认可 再 提高 到 企业 认可 的 高 度 。 


这 种 推动 方式 通常 需要 较 长 的 时 间 目 效果 很 难保 证 ， 主 要 原因 是 企业 内 部 原 有 的 企业 文化 、 部 门 利益 及 业务 人 员 的 基本 素质 直接 决定 了 数据 工作 建设 的 成 功 与 否 。 例 如 ， 对 于 传统 的 零售 商 而 言 ， 依 靠 
零售 经 


验 进行 工作 的 习惯 和 文化 较 重 ， 要 对 这 些 不 懂 互 联网 更 没有 数据 基础 的 人 员 进行 教育 和 推动 ， 其 难度 可 想 而 知 。 
(2) 目 上 而 下 的 推动 


自 上 而 下 的 推动 策略 是 唯一 可 以 将 数据 工作 真正 落地 的 策略 ， 基 于 公司 上 层 的 决策 压力 ， 再 配合 数据 底层 的 辅助 支持 ， 企 业 各 个 部 门 落地 数据 工作 的 效果 显著 。 


这 种 推动 策略 必须 具备 以 下 两 个 前 提 条 件 : 
* 数据 必须 是 站 在 公司 利益 的 角度 的 独立 主体 。 只 有 对 企业 整体 利益 负责 的 数据 才能 被 企业 领导 层 所 认可 ， 任 何 业务 体系 之 下 的 数据 部 门 都 很 难 客观 公正 的 开展 数据 工作 。 


. 企业 领导 层 必 须 对 数据 工作 有 清晰 的 认 知 。 企 业 领 导 层 了 解 这 种 数据 工作 文化 和 机 制 能 够 给 企业 带 来 哪些 利益 或 哪些 风险 ， 只 有 当 产 生 的 利益 大 大 超过 风险 时 领导 层 才 可 能 有 决心 、 有 信心 来 推动 实 


这 
Le] 


但 完全 的 自 上 而 下 的 推动 只 是 一 种 理想 状态 下 的 策略 ， 大 多 数 企 业 领 导 都 没有 完全 理解 并 推动 数据 价值 的 真正 落地 ， 而 仪 仅 停 留 在 “宣传 ”层面 。 作 为 数据 部 门 的 负责 人 ， 适 时 且 坚 持 不 懈 的 对 企业 领 
导 层 的 “教育 ”和 “价值 灌输 ” 必 不 可 少 。 
人 @@ 记 示 任何 关子 数据 的 落地 项 目 最 好 的 方式 还 是 自 上 而 下 ， 但 通常 更 多 的 会 将 自 下 而 上 和 自 上 而 下 这 两 种 方式 结合 起 来 共同 推进 。 
3. 对 象 策略 
对 象 策略 解决 的 问题 是 数据 流程 与 落地 管理 的 对 象 定位 问题 。 
数据 流程 与 落地 管理 的 对 象 既 包 括 数据 部 门 又 包括 业务 部 门 ; 既 包 括 执 行人 员 又 包括 上 层 领导 决策 人 员 。 


数据 部 门 是 产 出 数据 价值 的 主体 ， 而 业务 部 门 是 落地 数据 价值 的 主体 ， 两 者 不 可 分 割 ; 业务 是 数据 赖 以 生存 的 主体 ， 如 果 没 有 业务 需求 ， 数 据 部 门将 没有 存在 的 必要 性 。 数 据 流 程 与 落地 管理 既 涉 及 数 
据 部 门 内 部 的 工作 规范 ， 也 涉及 数据 部 门 与 业务 部 门 协 同 工 作 的 规范 ， 两 者 是 统一 的 整体 。 


执行 人 员 是 数据 落地 最 终 的 执行 者 ， 他 们 的 理解 程度 和 落地 程度 直接 决定 了 数据 对 业务 提升 效果 的 显著 与 否 ; 上 层 领导 人 员 的 决策 是 部 门 间 高 效 协 作 的 基础 ， 同 时 也 是 推动 自 上 而 下 策略 的 决策 者 。 因 
此 ， 两 类 人 和 群 都 不 可 或 缺 。 


4. 迭 代 策 略 
迭代 策略 指 的 是 数据 流程 与 落地 管理 要 根据 公司 和 业务 发 展 的 实际 情况 进行 迭代 更 新 。 


很 多 企业 不 是 缺少 规范 和 制度 ， 而 是 很 多 规范 和 制度 都 已 经 过 时 ， 当 其 不 能 符合 业务 的 实际 情况 时 ， 不 但 不 能 对 数据 工作 起 到 推动 作用 ， 还 会 由 于 种 种 榨 覆 形成 对 数据 工作 的 反 向 牵制 ， 甚 至 成 为 阻碍 
数据 工作 及 公司 正常 发 展 的 绊脚石 ， 因 此 流程 和 规范 的 迭代 管理 必 不 可 少 。 


迭代 管理 的 需求 一 方面 来 自 业 务 部 门 的 反馈 ， 另 一 方面 来 自 数据 部 门 定期 的 自我 审查 ， 人 迭代 管理 的 内 容 包 括 数据 流程 与 落地 管理 策略 和 具体 制度 规范 。 
5. 时 机 策略 

时 机 策略 解决 的 问题 是 在 一 个 什么 样 的 时 机 提出 并 推动 数据 流程 与 落地 管理 。 

选择 一 个 好 的 时 机 切入 是 保证 数据 流程 和 落地 管理 策略 被 认可 的 关键 要 素 之 一 ， 以 下 的 几 个 切入 时 机 较 好 : 

` 当 企业 内 部 不 存在 明显 的 业务 问题 或 业务 问题 没有 发 生 主 要 矛盾 时 ， 领 导 层 有 更 多 精力 关注 数据 问题 。 


当 企业 获得 一 笔 较 大 的 资金 回报 或 注入 时 ， 领 导 层 会 更 有 精力 考虑 数据 方面 的 问题 。 


. 当 企业 开始 建立 数据 部 门 时 ， 从 一 开始 就 提出 完整 的 工作 流程 和 落地 机 制 更 容易 实现 。 
" 当 数 据 分 析 人 员 为 单独 成 立 数据 中 心 或 直接 跟 领 导 决 策 层 汇报 时 ， 有 更 多 的 机 会 说 服 领导 层 。 
* 当主 要 竞争 对 手 已 经 开始 推行 数据 工作 流程 和 落地 机 制 时 ， 企 业 领 导出 于 竞争 心理 更 容易 接受 。 


" 当 有 十 足 的 把 握 通 过 落实 数据 工作 流程 和 落地 机 制 可 以 为 企业 带 来 明确 且 可 预期 价值 或 利润 时 ， 更 容易 说 服 领导 层 做 出 决定 。 


16.4 ”数据 流程 与 溢 地 管理 的 框架 
数据 流程 与 落地 管理 既 包 括 数据 工作 中 的 流程 体系 ， 又 包括 保证 数据 落地 效果 的 管理 和 培训 机 制 。 


16.4.1 ”数据 需求 管理 


1. 数 据 需 求 管理 的 含义 


数据 需求 是 其 他 部 门 提出 的 需要 数据 部 门 进行 处 理 的 内 容 ， 如 权限 管理 、 数 据 提取 、 分 析 报 告 、 数 据 挖掘 和 数据 产品 等 均 视 为 数据 需求 。 数 据 需 求 管理 是 提高 部 门 间 协 作 和 工作 效率 的 保证 ， 同 时 也 是 
保证 企业 数据 安全 的 重要 管理 措施 。 数 据 需 求 管理 是 针对 数据 需求 进行 规范 和 管理 的 过 程 ， 包 括 需 求 沟通 、 提 报 、 人 处理 和 反馈 四 个 环节 。 


2. 数 据 需 求 管理 的 范畴 
数据 需求 管理 适用 于 企业 内 部 的 所 有 与 数据 相关 的 需求 管理 工作 ， 规 范 的 主体 对 象 包括 需求 提出 方 和 需求 处 理 方 。 
针对 需求 提出 方 需要 规范 业务 部 门 的 对 接 人 员 、 对 接 流程 和 跟 进 流程 ， 针 对 需求 处 理 方 需要 规范 处 理 对 接 人 、 处 理 流程 等 内 容 。 


@ia 示 如 果 企 业 部 门 较 多 ， 建 议 采 用 数据 对 接 人 制度 ， 将 不 同业 务 部 门 负责 数据 对 接 工作 的 人 员 固 定 下 来 。 数 据 对接 人 是 数据 部 门 与 业务 部 门 的 沟通 桥梁 ， 承 担 了 内 部 需求 沟通 、 需 求 提 报 、 需 求 跟 
进 和 需求 答复 的 工作 。 这 种 制度 一 方面 可 以 提高 数据 协同 和 沟通 效率 ， 另 一 方面 数据 对 接 人 可 以 进行 初步 的 数据 沟通 和 校 验 工作 ， 从 而 提高 数据 在 业务 内 部 的 落地 效果 。 


3. 数 据 需求 管理 的 内 容 

数据 需求 管理 分 为 需求 沟通 、 需 求 提 报 、 需 求 处 理 和 需求 反馈 四 个 阶段 。 

(1) 需求 沟通 

数据 需求 管理 的 第 一 步 是 进行 需求 沟通 ， 需 求 沟通 是 对 数据 需求 合理 性 、 必 要 性 和 有 效 性 的 审核 。 需 求 沟通 是 需求 处 理 的 必要 阶段 ， 对 业务 部 门 和 数据 部 门 都 具有 重要 意义 : 
对 业务 部 门 来 讲 ， 需 求 沟通 可 以 让 业务 部 门 更 加 清晰 的 认识 数据 在 实际 工作 中 的 意义 ， 同 时 能 减少 无 效 需求 对 业务 工作 时 间 的 占用 以 及 其 他 资源 的 消耗 。 
“ 对 数据 部 门 来 讲 ， 通 过 沟通 可 以 直接 过 滤 掉 无 效 数据 需求 ， 从 而 节省 无 效 数据 工作 时 间 及 数据 资源 分 配 。 

以 下 几 种 需求 是 应 该 在 沟通 阶段 就 直接 予以 驶 回 的 : 

由 于 数据 问题 导致 无 法 实现 的 需求 ， 当 前 的 数据 无 法 实现 业务 目标 所 需要 求 。 例 如 ， 数 据 类 型 不 足 、 数 据 量 不 够 、 数 据 时 间 范 围 过 短 、 数 据 字段 缺失 等 。 
. 错误 的 业务 需求 。 例 如 ， 想 要 通过 数据 证 明 营 销 费 用 跟 流量 数量 之 间 不 存在 明显 关系 。 

无 法 落地 的 业务 需求 。 如 果 处 理 完 成 之 后 的 数据 结论 对 业务 来 讲 无 法 落地 ， 那 么 意味 着 此 次 数据 工作 几乎 没有 实际 意义 。 

. 重复 的 业务 需求 。 对 于 业务 部 门 之 前 已 经 提 报 的 相同 并 且 处 理 完成 的 需求 无 须 重复 处 理 。 

如 果 数 据 需 求 合理 并 且 能 够 通过 数据 工作 为 业务 提供 有 价值 的 落地 建议 ， 那 么 数据 需求 进入 下 一 阶段 一 一 需求 提 报 。 


人 十 示 很 多 时 候 业 务 需 求 不 能 落地 ， 例 如 数据 提取 工作 只 是 为 了 验证 工作 效果 ， 对 于 此 类 简单 的 需求 需要 通过 培训 、 开 放权 限 等 方法 让 业务 部 门 自行 实现 。 数 据 部 门 不 应 该 把 时 间 浪 费 在 这 种 价值 低 
的 工作 上 。 


(2) 需求 提 报 


数据 提 报 是 数据 需求 二 次 审核 过 程 。 对 很 多 大 型 公司 而 言 ， 数 据 沟通 结果 的 可 行 性 和 合理 性 只 是 为 了 确认 需求 是 否 能 实现 以 及 是 否 具 有 实现 价值 ， 而 需求 提 报 的 审核 阶段 是 通过 公司 流程 对 需求 做 进 一 
步 评估 以 保证 业务 需求 符合 公司 利益 。 


在 大 多 数 情况 下 ， 以 下 需求 场景 都 是 重点 评估 对 象 


“ 敏感 性 指标 。 数 据 需求 中 涉及 企业 核心 指标 如 利润 等 ， 这 些 指 标 只 能 给 特定 人 员 开 发 权限 。 


` 过 高 的 数据 权限 。 当 申请 访问 企业 内 多 个 数据 库 或 具有 多 种 可 操作 权限 时 ， 企 业 会 严格 评估 申请 人 是 否 具有 该 项 资格 。 
* 数据 加 密 处 理 。 如 果 数据 结果 因为 后 期 工作 需要 不 能 加 密 ， 那 么 数据 就 存在 泄露 的 风险 。 
. 公司 外 部 的 数据 处 理 ， 某 些 场景 下 企业 内 部 数据 需要 在 公司 之 外 进行 处 理 。 例 如 ，SAAS 模 式 的 服务 等 ， 这 些 都 会 对 数据 造成 泄露 风险 。 


需求 提 报 通常 通过 公司 内 部 OA 系统 或 其 他 流程 管理 系统 进行 监管 ， 根 据 数据 需求 层级 的 不 同 ， 流 程 中 的 对 象 可 能 包括 数据 对 接 人 、 数 据 负责 人 人、 中心 负责 人 、 企 业 VP 甚 至 CEO。 权 限 要 求 越 高 、 涉 及 
范围 越 大 、 数 据 风 险 越 高 的 需求 ， 涉 及 的 公司 核心 领导 越 多 ， 因 此 数据 提 报 流程 也 越 长 。 数 据 需 求 提 报 审批 完成 后 ， 可 进入 下 一 阶段 的 需求 处 理 流程 。 


人 证 示 数据 需求 提 报 管理 是 数据 需求 审核 不 可 或 缺 的 步 又， 在 很 多 大 型 企业 中 往往 是 企业 级 流程 管理 的 重要 部 分 。 在 需求 提 报 的 管理 过 程 中 ， 企 业 领 导 层 从 企业 全 局 的 角度 把 控 数 据 需求 是 否 合理 ， 
其 决策 关乎 整个 公司 而 非 数 据 部 门 。 


(3) 需求 处 理 
数据 需求 处 理 管理 是 对 数据 处 理 流程 的 约束 。 


在 完成 数据 提 报 审批 后 ， 接 下 来 需要 对 数据 的 具体 细节 进行 沟通 ， 包 括 具体 目标 、 数 据 范围 、 数 据 类 型 等 。 同 时 还 要 指定 需求 由 谁 处 理 、 什 么 时 间 处 理 、 什 么 时 间 反 馈 结果 、 反 馈 标准 如 何 ， 如 果 是 涉 
及 长 期 工作 项 目的 还 要 对 阶段 性 结果 进行 规范 。 需 求 处 理 是 数据 工作 的 核心 环节 ， 有 关 需 求 处 理 的 具体 流程 会 在 本 章 16.4.2“ 项 目 工 作 流 程 ”中 具体 介绍 。 


(4) 需求 反馈 


需求 反馈 是 在 需求 处 理 完成 后 ， 按 照 需求 处 理 过 程 中 确认 的 预期 结果 和 标准 ， 通 过 一 定形 式 反 馈 给 指定 对 接 人 。 对 于 涉及 敏感 数据 结果 的 需求 反馈 ， 在 有 反馈! 形式、 数据 结果 的 加 密 、 数 据 查 看 范围 、 数 
据 时 效 性 等 方面 需要 严格 按照 流程 审批 结果 执行 。 


ise 示 很 多 分 析 师 可 能 认为 这 种 流程 过 于 烦 天 ， 数 据 需 求 直接 反馈 给 提 报 人 或 对 接 人 效率 会 更 高 。 本 书 不 断 提 及 数据 的 安全 性 是 开展 数据 工作 的 前 提 ， 缺 乏 数据 安全 保证 的 数据 工作 宁可 不 做 也 不 能 
对 企业 造成 负面 影响 。 


16.4.2 ”项 目 工作 流程 


1. 项 目 工作 流程 的 含义 


数据 项 目 工 作 是 中 级 以 上 数据 分 析 师 的 主要 工作 内 容 ， 项 目 工作 意味 着 分 析 师 需要 在 一 定 周期 内 专注 于 某 个 数据 问题 开展 工作 。 


常见 的 数据 项 目 工作 包括 专项 数据 分 析 、 专 项 数据 挖 气 、 市 场 调研 分 析 、 用 户 研究 、 数 据 产品 开发 等 工作 。 数 据 项 目 工作 区 别 与 其 他 数据 工作 的 特点 在 于 以 下 几 个 方面 : 


. 专注 性 。 数 据 项 目 是 专注 投入 的 工作 ， 要 求 数据 从 业者 必须 投入 比 其 他 工作 更 多 的 精力 才能 解决 项 目 中 存在 的 问题 。 


“ 长 期 性 。 项 目 工作 的 最 短 周期 是 一 周 ， 某 些 大 型 项 目 可 能 需要 数 月 才能 完成 。 


项 目 工作 是 对 菜 一 问题 的 专项 研究 和 深入 建设 工作 ， 通 常 具备 较为 完整 的 知识 特征 并 可 能 是 企业 整体 战略 实施 的 一 部 分 。 


* 群体 参与 。 复 杂 的 项 目 通常 需要 多 人 参与 ， 不 同人 员 有 不 同 的 分 工 。 


“ 结果 导向 性 。 项 目 工作 通常 具有 明确 的 项 目 目 标 ， 同 时 可 通过 一 定 的 标准 进行 测量 。 


2. 项 目 工 作 流 程 的 范畴 


项 目 工 作 流 程 的 适用 范围 包括 以 下 三 方面 的 内 容 : 


* 项 目 流程 是 面向 业务 层 的 ， 与 面向 技术 产品 开发 的 项 目 工作 相 比 具有 一 定 的 差异 性 。 


* 项 目 工 作 适 用 于 具有 一 定 能 力 的 分 析 师 ， 其 需要 具备 扎实 的 数据 知识 、 较 好 的 数据 理解 和 处 理 能 力 ， 能 够 通 


* 项 目 工作 以 落地 和 业务 驱动 为 主要 目的 ， 面 向 高 层 领 导 的 市 场 分 析 或 战略 分 析 不 完全 适用 于 数据 项 目 工作 流程 。 


3. 项 目 工作 流程 的 内 容 


完整 的 数据 项 目 工作 流程 应 根据 不 同 的 项 目 类 型 和 内 容 而 定 ， 但 面向 业务 的 、 具 有 落地 特征 的 流程 通常 包括 需求 沟通 、 


为 一 个 简单 的 落地 型 数据 挖掘 项 目 工作 流程 ， 接 下 来 以 30 天 为 工作 周期 具体 介绍 每 个 阶段 的 工作 内 容 和 产 出 。 
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需求 沟通 已 经 在 数据 需求 管理 中 提 及 ， 不 合理 或 不 可 行 的 需求 将 直接 被 驳回 。 正 常情 况 下 ， 需 求 沟通 当天 应 该 反馈 沟通 结果 。 


(2) 需求 提 报 


过 数据 方法 解决 业务 问题 。 


制定 落地 


在 需求 提 报 阶段 ， 不 符合 公司 利益 或 可 能 对 公司 产品 有 负面 影响 的 需求 也 将 被 驳回 。 需 求 提 报 和 审批 根据 不 同 企业 的 流程 复杂 程度 和 实际 审批 效率 而 定 ， 


的 具体 内 容 请 参照 本 章 16.4.1 “数据 需求 管理 ”。 


(3) 商业 理解 


通常 在 1~7 天 之 内 完成 


商业 理解 是 将 业务 语言 转化 为 数据 语言 的 过 程 ， 目 的 是 确定 业务 预期 效果 的 维度 、 范 围 等 ， 这 个 阶段 通常 需要 2~ 3 天 的 工作 时 间 。 商 业 理 解 阶段 包括 以 下 两 部 分 内 容 : 


需求 提 报 、 商 业 理 解 、 数 据 准 备 、 数 据 挖掘 、 部 署 实施 六 部 分 内 容 。 图 16-1 所 示 


需求 沟通 和 需求 所 报 


` 商业 理解 沟通 。 数 据 部 门 理解 业务 部 门 具体 需求 的 过 程 。 
“ 数据 思路 沟通 。 数 据 部 门将 业务 理解 转化 为 数据 分 析 和 挖掘 思路 的 过 程 。 


本 阶段 的 产 出 是 数据 分 析 和 挖掘 工作 思路 ， 通 常 以 思维 导 图 的 形式 输入 并 加 以 沟通 确认 。 图 16-2 所 示 为 渠道 画像 分 析 思 路 。 
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(4) 数据 准备 
数据 准备 是 对 即将 进行 的 分 析 和 挖掘 工作 进行 预 处 理 ， 包 括 从 数据 仓库 中 取 数 、 验 证 数据 质量 、 数 据 特 征 提取 、 异 常 值 处 理 、 数 据 转换 和 合并 等 ， 为 后 期 的 数据 分 析 挖 掘 做 准备 。 这 个 阶段 是 费时 但 非 
常 重 要 的 工作 ， 在 数据 准备 前 期 这 个 工作 做 不 好 会 直接 影响 数据 质量 ， 从 而 影响 结果 的 可 信 度 及 稳定 程度 。 


该 项 工作 通常 需要 1~4 天 的 工作 时 间 ， 根 据 原 始 数据 质量 及 数据 量 级 的 不 同 而 有 所 差异 。 阶 段 性 数据 产 出 结果 为 数据 质量 报告 以 及 清洗 之 后 的 数据 。 
@ 提 示 妆 据 准备 是 数据 工作 中 的 难点 ， 很 多 时 候 由 于 原始 数据 质量 较 差 或 数据 从 业者 自身 工作 经 验 和 能 力 不 足 ， 导 致 大 量 时 间 耗 费 在 数据 准备 和 清洗 阶段 ， 使 得 后 期 数据 价值 挖 据 的 投入 精力 不 足 ， 


从 而 影响 数据 结果 和 价值 产 出 。 因 此 ， 这 个 阶段 一 定 要 在 保证 数据 质量 的 基础 上 缩减 投入 时 间 。 


(5) 数据 挖掘 
专项 分 析 和 挖掘 工作 ， 包 括 常用 的 描述 性 数据 统计 : 数据 分 类 、 聚 类 、 预 测 、 序 列 关 联 、 规 则 提取 等 建 模 工 作 ， 并 人 在 专项 分 析 或 建 


经 过 前 期 的 各 项 准备 工作 ， 接 下 来 就 开始 了 数据 工作 的 核心 环节 
模 结束 后 完成 模型 测试 和 评估 工作 ， 以 保持 模型 的 稳定 性 和 最 佳 拟 合 度 。 


需要 至 少 一 周 的 时 间 ， 产 出 结果 包括 数据 挖掘 流 、 数 据 挖掘 报告 等 。 在 报告 中 需要 将 数据 挖掘 的 背景 、 数 据 选取 和 处 理 方 法 、 异 常 值 处 理 措施 、 数 据 建 模 主 要 流程 、 数 据 挖 掘 结 果 评估 和 解 


本 阶段 通常 需 
读 说 明 等 内 容 进行 描述 ， 这 也 是 规范 数据 挖掘 工作 的 必要 措施 。 


(6) 部 署 实施 

部 署 实施 包括 数据 结果 沟通 、 制 定 落地 方案 、 业 务 落地 执行 、 数 据 再 优化 四 个 阶段 。 

* 数据 结果 沟通 : 数据 结果 沟通 可 能 通过 邮件 、 会 议 等 方式 进行 ， 沟 通 的 内 容 主要 是 围绕 业务 需求 和 数据 结果 ， 还 包括 对 数据 结论 的 进一步 深入 讨论 。 

- 制定 落地 方案 ; 在 沟通 过 程 中 需要 有 落地 方案 的 制定 部 分 ， 即 根据 数据 结论 和 建议 确定 下 一 步 工 作 计 划 和 排 期 。 

. 业务 落地 执行 : 根据 业务 制定 的 落地 方案 跟 进 实施 ， 实 施 过 程 中 同步 监测 数据 反馈 结果 。 

* 数据 再 优化 : 针对 执行 结果 做 模型 和 数据 结论 的 调整 优化 ， 从 而 不 断 迭 代 项 目 进 程 ， 直 至 达到 理想 业务 目标 或 业务 预期 。 

在 整个 项 目 结束 后 通常 会 进行 项 目 总 结 ， 总 结 内 容 包 括 前 期 需求 沟通 是 否 清晰 ， 中 期 数据 处 理 、 分 析 和 挖 握 存 在 哪些 可 优化 点 ， 后 期 数据 落地 效果 和 协作 流程 改进 等 。 


总 疆 


人 证 示 不 是 所 有 的 项 目 都 以 成 功 结束 ， 很 多 时 候 会 由 于 主 、 客 观 原 因 导 致 项 目的 失败 。 但 项 目 失 败 也 是 一 种 知识 成 长 过 程 ， 此 时 更 应 该 与 业务 部 门 一 起 深入 总 结 ， 以 避免 上 日 后 出 现 类 似 的 失败 问题 。 


二 
~7/ 


本 阶段 的 时 间 大 概 为 两 周 左 右 ， 具体 以 业务 落地 执行 时 间 为 主 。 产 出 结果 包括 业务 落地 计划 方案 、 落 地 执行 结果 评估 报告 等 。 


16.4.3 ”数据 培训 体系 


1. 数 据 培 训 体系 的 含义 

数据 培训 体系 是 针对 数据 意识 、 数 据 理解 、 数 据 工具 以 及 数据 能 力 的 培训 。 数 据 培 训 是 提高 数据 意识 ， 建 立 企业 数据 工作 文化 的 必 经 之 路 ， 这 是 一 个 长 期 的 、 循 序 渐进 的 过 程 。 
2. 数 据 培训 体系 的 范畴 

数据 培训 的 对 象 是 企业 内 部 所 有 与 数据 有 关 的 人 员 。 

. 从 培训 对 象 的 级 别 来 看 ， 上 至 CEO 等 领导 和 决策 层 ， 下 至 普通 执行 员工 都 是 数据 培训 和 教育 的 对 象 。 

: 从 培训 对 象 的 部 门 来 看 ， 既 包括 数据 内 部 员工 ， 又 包括 数据 部 门 以 外 的 员工 。 

3. 数 据 培训 体系 的 内 容 

数据 培训 体系 包括 数据 工具 应 用 、 数 据 知 识 理解 、 数 据 意识 培养 三 方面 内 容 。 

(1) 数据 工具 应 用 

每 个 企业 都 有 很 多 数据 工具 ， 数 据 工具 按照 功能 和 用 途 可 分 为 以 下 四 类 : 

数据 存储 与 提取 工具 ， 典 型 工具 如 数据 库 类 的 Access、MySQL、Oracle、SQL Server、DB2、Sybase， 数 据 提取 类 的 Navicat、 数 据 工具 中 的 ODBC 接 口 和 数据 客户 端 工具 。 


数据 分 析 与 挖掘 工具 ， 典 型 工具 如 日 常 工 具 Excel (重点 是 了 测 数 和 数据 分 析 模 块 ) ， 专 业 数 据 工具 Google Analytics、SPSS、Clementine、Python、R 等 。 


: 数据 可 视 化 工具 ， 典 型 工具 如 Excel、PPT、Tableau、QIlik、 水 蝇 易 表 等 。 
- 商业 智能 (BI) 类 工具 ， 大 型 企业 通常 付费 购买 商用 BI 产品 。 例 如 ， 微 软 SQL Server BI[、IBM 的 Cognos、Oracle 的 BIEE、SAP 的 BO 和 BW 等 。 


数据 工具 培训 的 目的 是 提高 数据 操作 能 力 ， 使 得 培训 对 象 具有 满足 日 常 需求 的 基本 数据 工作 能 力 。 例 如 ， 业 务 人 员 只 需要 了 解 基 本 数据 查询 、 简 单 处 理 和 分 析 功 能 ， 即 可 满足 大 多 数 日 常 需求 ， 而 专业 
数据 分 析 师 需要 根据 自身 工作 定位 掌握 至 少 一 门 数据 工具 ， 同 时 能 有 一 专 多 通 的 能 力 。 


(2) 数据 知识 理解 

数据 知识 是 指 专业 数据 基础 知识 ， 包 括 以 下 四 类 : 
基本 数据 收集 方法 和 原理 。 例 如 ， 网 站 数据 采集 的 基本 方法 以 及 能 跟踪 到 的 数据 信息 。 
. 企业 数据 维度 和 指标 ,日常 工作 中 涉及 的 维度 和 指标 的 含义 、 公 式 、 定 义 标 准 等 。 
. 统计 学 知识 。 如 对 极 值 、 正 太 分布 、 相 关 性 、 数 据 标准 化 、 抽 样 等 基本 知识 的 理解 。 
“ 数据 挖掘 知识 。 不 同 模型 的 计算 原理 、 结 果 指 标的 解读 等 知识 。 


以 上 四 类 知识 不 是 要 求 所 有 的 业务 人 员 都 要 掌握 ， 而 是 要 根据 日 常 工作 情况 进行 有 针对 性 的 理解 和 学 习 ， 这 样 便于 业务 部 门 和 数据 部 门 的 有 效 沟通 ， 同 时 也 能 提高 业务 部 门 自身 的 工作 能 力 和 水 平 。 对 
于 专门 从 事 数据 的 从 业 人 员 来 齐 ， 必 须 完 全 掌握 基础 数据 知识 ， 其 他 知识 可 根据 自身 工作 需要 而 定 ， 通 常 掌握 的 知识 越 多 越 利于 开展 工作 。 


(3) 数据 意识 培养 


数据 意识 培养 是 数据 培训 和 数据 工作 中 的 难点 ， 同 时 也 是 数据 工作 的 重点 。 数 据 意识 指 理解 数据 能 实现 哪些 需求 、 数 据 能 带 来 哪些 提升 、 如 何 将 业务 问题 转化 为 数据 问题 等 。 更 重要 的 是 ， 要 培养 业务 
人 员 在 有 所 行动 之 前 先 想到 数据 可 能 会 带 来 一 些 启 发 ， 这 才 是 数据 意识 的 高 境界 。 


isa 示 由 于 大 多 数 企 业 领 导 层 对 数据 缺乏 完整 认 知 ， 因 此 在 数据 意识 的 培训 过 程 中 ， 针 对 领导 层 的 数据 意识 灌输 必 不 可 少 。 


有 关 数 据 意识 培养 的 知识 ， 请 参照 本 书 第 3 章 3.4 中 “业务 需求 是 数据 分 析 的 起 点 ， 但 之 前 你 需要 培养 业务 的 数据 意识 ”了 解 详细 信息 。 
16.4.4 权限 管理 流程 


1. 数 据 权 限 管理 的 含义 


数据 权限 管理 是 企业 数据 管理 的 基础 模块 ， 每 个 企业 或 多 或 少 都 有 数据 权限 管理 制度 。 数 据 权 限 管理 包括 数据 可 访问 管理 、 可 修改 管理 和 共享 数据 管理 。 数 据 权限 管理 是 降低 数据 被 非法 生成 、 变 更 、 
泄露 、 丢 失 及 破坏 的 重要 措施 。 


Oi 数据 权限 的 隐藏 本 质 是 “信任 度 ”。 站 在 企业 角度 ， 哪 些 人 应 该 信任 ,哪些 人 还 需要 考验 都 应 通过 权限 反映 出 来 。 这 种 信任 度 不 仅 影 响 权 限 管理 ， 还 对 整个 数据 工作 产生 影响 。 信 任 度 的 产生 
主要 依赖 于 企业 领导 层 的 信心 而 不 是 工作 能 力 ， 如 何 让 领导 相信 自己 ， 是 获得 信任 感 的 主要 因素 。 


2 数据 权限 管理 的 范畴 
数据 权限 管理 的 范畴 包括 以 下 三 个 方面 的 内 容 。 
` 数据 范围 : 数据 权限 管理 通常 涉及 所 有 数据 采集 、 处 理 、 存 储 和 应 用 系统 ， 而 不 是 特定 的 某 个 数据 库 表 中 已 有 的 数据 。 


* 流程 范围 : 数据 权限 管理 涉及 数据 查看 、 人 修改、 更新、 提取 、 共 享 和 流通 等 整个 流程 ， 而 不 仅 是 数据 查看 权限 。 


人员 范 围 ; 数据 权限 管理 通常 适用 于 企业 内 部 所 有 部 门 的 员工 ， 而 不 仅仅 是 针对 基层 员工 。 
3. 数 据 权限 管理 的 内 容 

数据 权限 管理 的 内 容 包 括 数 据 查 看 权限 、 数 据 修改 权限 和 数据 流通 权限 管理 。 

(1) 数据 查看 权限 

数据 查看 权限 可 分 为 访问 地 域 权 限 、 数 据 范 围 权限 、 数 据 字段 权限 三 部 分 。 


` 访问 地 域 权限 : 很 多 企业 关键 数据 只 能 在 企业 内 部 访问 或 通过 特定 IP 访 问 ， 企 业 外 部 通常 无 法 访问 或 必须 通过 “堡垒 机 ” 接 入 。 


“ 数据 范围 权限 : 数据 范围 权限 指 可 以 访问 的 数据 库 和 表 的 范围 ， 通 俗 地 讲 是 能 看 哪些 表 不 能 看 哪些 表 ， 这 是 大 多 数 企业 进行 限制 的 主要 形式 。 


A AAA 


“ 数据 字段 权限 : 某 些 企业 还 会 对 数据 字段 进行 控制 。 例 如 ， 同 样 的 会 员 表 可 能 只 允许 查看 部 分 字段 ， 而 对 于 手机 号 、 邮 箱 等 则 无 法 查看 。 


(2) 数据 修改 权限 


大 多 数 企 业内 部 IT 体系 之 外 的 部 门 都 不 具有 修改 权限 ， 如 更 新 、 修 改 、 删 除 等 。 特 殊 情 况 下 ， 针 对 数据 部 门 建立 的 “附属 库 ” 可 能 具有 一 定 的 可 编辑 权限 ， 但 针对 业务 体系 的 数据 都 不 能 具有 修改 权 
限 。 


(3) 数据 流通 权限 


数据 流通 权限 指数 据 可 进行 传播 和 流通 的 权限 ， 具 体 功能 包括 : 打印 、 复 制 、 导 出 、 加 密 等 。 数 据 流通 权限 管理 是 数据 防 泄漏 管理 的 主要 途径 之 一 ， 从 某 种 程度 上 说 ， 没 有 数据 流通 就 意味 着 不 会 有 数 
据 港 圳 风险 。 原 则 上 ， 所 有 内 部 数据 的 流通 都 需要 经 过 加 密 处 理 。 


je 示 。 救 据 加 窗 处 理 针对 的 是 有 人 工 直接 参与 的 数据 流通 过 程 ， 包 括 业务 部 门 和 数据 部 门 的 人 员 。 通 常 原始 数据 级 别 的 数据 流通 会 通过 API 或 数据 同步 进行 交换 ， 因 此 对 于 最 细 粒 度 的 数据 需求 通常 
通过 数据 库 直 接 进 行 管理 和 控制 。 
16.4.5 ”数据 知识 管理 

1 .数据 知识 管理 的 含义 

数据 知识 管理 是 通过 一 定 的 途径 和 渠道 进行 知识 分 享 和 学 习 ， 使 得 企业 所 有 部 门 都 可 以 参与 到 数据 知识 的 建设 和 沉淀 过 程 中 。 

2 数据 知识 管理 的 意义 


数据 知识 体系 建设 和 管理 是 数据 文化 建设 的 重要 组 成 部 分 ， 它 通过 数据 知识 的 获取 、 创 造 、 分 享 、 整 合 、 记 录 、 更 新 等 过 程 ， 不 断 作 用 于 知识 系统 内 部 ， 将 个 人 的 知识 不 断 累 积 形成 组 织 共 同 的 智慧 和 
财富 ， 然 后 将 群体 创造 的 知识 回馈 到 企业 内 部 决策 和 实施 过 程 中 ， 从 而 促进 数据 资产 的 形成 和 数据 工作 文化 的 落地 。 


完善 的 数据 知识 管理 具有 以 下 典型 作用 : 


: 通过 案例 学 习 的 方式 对 业务 进行 数据 知识 教育 。 


tS 


“ 避免 人 员 流 失 造 成 的 数据 知识 流失 。 

增加 业务 部 门 与 数据 部 门 的 协作 和 凝聚 力 。 

. 通过 知识 的 迭代 管理 促进 知识 的 演进 和 创新 。 

` 企业 知识 创新 的 钥 化 器 ， 抢 占 未 来 竞争 制高点 的 重要 途径 。 

3. 数 据 知识 管理 的 内 容 

数据 知识 管理 的 内 容 包 括 数 据 知 识 库 建设 、 数 据 交 流 区 建设 、 数 据 基 础 知识 建设 。 
(1) 数据 知识 库 建设 


数据 知识 库 主 要 通过 数据 分 析 和 挖掘 案例 的 形式 进行 知识 讲解 。 通 常 ， 每 次 的 数据 结果 产 出 都 需要 总 结 成 数据 案例 ， 通 过 对 当时 数据 场景 的 详细 描述 和 记载 将 数据 工作 成 果 总 结 成 案例 以 供 大 家 学 习 。 
案例 式 学 习 是 最 有 效 的 一 种 知识 学 习 和 应 用 方法 。 


(2) 数据 交流 区 建设 
很 多 大 型 企业 都 有 内 部 数据 交流 区 ， 如 论坛 、 博 客 甚 至 是 WIKI 系 统 ， 这 些 交 流 区 是 内 部 数据 想法 的 交流 阵地 ， 也 是 内 部 线 上 沟通 和 学 习 的 主要 场所 之 一 。 
(3) 数据 基础 知识 建设 


数据 基础 知识 建设 是 针对 数据 工作 中 常用 的 知识 点 进行 讲解 ， 这 些 知识 点 通常 以 标准 术语 的 形式 进行 定义 ， 同 时 可 以 结合 案例 深入 浅 出 的 介绍 基本 数据 理论 和 应 用 场景 ， 便 于 业务 有 效 理解 。 另 外 ， 第 
14 章 14.4.1 “数据 质量 管理 ”中 的 数据 标准 或 元 数据 也 可 以 作为 数据 基础 知识 的 重要 组 成 部 分 。 


对 于 数据 知识 管理 的 落地 工具 ， 可 用 的 包括 WIKI 百科 系统 ， 论 坛 、 博 客 等 交流 工具 ， 以 及 SVN 等 版 本 的 控制 系统 等 。 具 体 使 用 哪 种 工具 是 次 要 的 ， 只 要 能 实现 内 部 数据 获取 、 分 享 、 整 合 、 记 录 、 更 新 
等 操作 的 工具 都 可 以 作为 知识 管理 的 工具 使 用 。 


16.5 本章 小 结 


= 


本 章 主要 围绕 数据 流程 与 落地 管理 的 相关 内 容 进 行 介绍 ， 数 据 落地 是 数据 发 挥 价值 的 最 终 目 的 ， 与 乙 相 应 的 落地 管理 也 是 促进 数据 落地 的 重要 保证 。 本 章 需 要 读者 重点 掌握 的 知识 点 如 下 : 
* 数据 流程 和 落地 管理 的 重要 意义 ， 尤 其 对 于 大 型 企业 而 言 ， 流 程 化 、 标 准 化 、 工 程 化 是 基本 工作 特征 。 

数据 流程 与 落地 管理 的 框架 ， 重 点 是 数据 需求 管理 、 项 目 工 作 流程 、 数 据 培 训 体系 和 数据 知识 管理 ， 数 据 知识 管理 往往 被 大 家 所 忽略 。 

本 章 内 容 侧重 于 如 何 保障 数据 更 好 地 落地 并 产生 更 大 的 业务 价值 ， 结 合 企业 的 实际 情况 ， 请 读者 思考 以 下 几 个 问题 : 

当前 企业 是 否 存 在 “需求 过 多 而 无 法 处 理 ” 的 情况 ?如 何 进一步 过 滤 无 效 需求 ， 把 数据 工作 的 重点 集中 到 能 产生 数据 价值 的 主要 矛盾 点 上 ? 

“ 制定 一 份 数据 沟通 和 培训 方案 ， 目 的 是 提升 业务 部 门 的 数据 工作 意识 。 

` 企业 内 部 的 数据 知识 体系 是 否 完善 ， 应 该 从 哪些 方面 进行 梳理 和 补充 ? 


" 如 果 你 作为 数据 部 门 的 负责 人 ， 应 该 如 何 获 得 企业 领导 的 信任 感 并 得 到 领导 的 工作 支持 ? 


附录 A ”网 站 分 析 工 具 的 特性 及 代码 部 署 


附录 A 的 第 一 部 分 内 容 提供 了 网 站 数据 分 析 中 两 个 典型 工具 在 网 站 端的 功能 列表 (默认 报表 和 指标 ) ， 以 方便 读者 了 解 世界 级 工具 的 完整 特性 ， 这 些 工具 由 于 其 付费 的 特性 导致 大 多 数 国内 读者 都 没有 
机 会 接触 (其 他 工具 在 本 书 第 5 章 有 简要 介绍 ) 。 它 们 是 Webtrekk (主要 是 Q3) 和 Adobe Analytics (主要 是 Sitecatalyst) 。 


附录 A 的 第 二 部 分 内 容 提供 了 最 新 的 基于 Universal Analytics 的 完整 代码 部 署 示 例 ， 包 括 默 认 跟 中 ， 常 用 的 自 定义 跟踪 设置 如 自 定义 事件 追踪 、 虚 拟 页 面 、 社 交互 动 、 自 定义 页 面 名 称 、 追 踪 用 户 登录 或 
注册 ID、 增 强 的 链接 归 因 、 重 命名 全 局 变量 、 启 用 受众 特征 和 兴趣 报告 、 普 通电 子 商务 追踪 以 及 最 新 更 新 的 增强 型 电子 商务 追踪 。 


A.1 网 站 分 析 工 具 功 能 列表 
1.Webtrekk Q3 


Webtrekk Q3 上 默认 报告 列表 如 下 。 
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得 震 网 站 热 图 基于 像素 的 热力 图 
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操作 系统 
WAP/ 移动 系统 
移动 设备 客户 端 
称 动 议 音 制造 商 
移动 设备 连接 类 型 
屏幕 分 辩 率 
训 镍 厂 分 辩 府 
Javascript 


连接 速度 


系 弦 环境 


URM Dashboard 
URM 探索 
CRM 探索 
URM 性 别 
URM 年 齿 


URM 客户 关系 管理 


特殊 说 明 


UserID 报表 
VisitorID 报表 


高 级 细 分 报表 
SessionID 报表 
目 定 义 会 请 参数 
日 定义 会 十 倒数 
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其 他 自 定 疼 URL 属性 
Cohort Dashboard 
流量 来 源 树 
访问 来 源 
访问 来 源 类 别 
访问 源 一 自然 与 付费 对 比 
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站 站 搜索 关键 词 
站 外 搜索 关键 字 
贞 内 搜索 关键 字 
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页 面 URL 
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搜索 语 宫 


市 场 展 销 
市 场 营销 活动 概览 
市 场 营销 活动 树 
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市 场 营 销 活 动 类 别 
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RFM 模型 报表 


RFE 模型 报表 


CRM 目 定 义 值 
CRM 目 定 义 值 
CRM 自 定 多 值 
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用 户 留存 分 析 报 表 
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稼 户 路 径 中 的 访问 来 源 

客户 接触 点 分 布 

营销 活动 生命 周期 长 度 

市 场 关 铂 得 立 营销 活动 生命 周期 长 度 


“ 告 媒体 路 径 细 分 访问 渠道 路 径 
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细 分 搜索 词 路 径 
聚合 搜索 词 路 径 


导航 概 侦 
和 抽 面 树 形 图 页 面 稍 构 报 表 


页 面 路 径 表 
页 面 路 社 玫 


下 一 级 南面 别 
下 第 二 级 页 面 

一 级 页 面 路 征 图 示 页 面 路 径 图 
新 级 页 面 路 径 图 未 页 面 路 径 图 
内 容 组 1 

内 容 组 2 
内 容 组 3 


Content Groupl 


Content Group2 
Content Group3 


见面 URL 


导航 


目 定 尺 事 件 
目 定 关 事 件 人 参数 


油 斗 分 勿 报表 
站 内 流 媒体 报表 


媒体 播放 长 度 分 布 
媒体 带宽 (比特 / 秒 ) 
媒体 播放 器 音量 


组 分 访问 来 源 路 径 
CE 从 i 器 来 中 有 全 
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上 体 播 放送 操作 
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测试 
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网 站 目标 


Prod Cat Levell 电大 别 1 
电子 商务 Prod Cat Level2 “号 类 别 2 
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Prod Cat Level3 类别 3 
Product Images 和 有 | 片 - 


电子 商务 参 交 目 定义 转化 参数 
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关联 模型 报表 


5 

这 
这 上 

| 

la 下 


日 定义 通 目 过 目 定 义 参 效 实 现 目 定义 维度 ， 默 认 数 量 为 20 个 ， 可 添加 


Webtrekk Q3 默 认 指标 如 下 。 


指 标 指 标 
Alexa 后 链 Yahoo 反 回 链接 
Alexa 排名 Yahoo 索引 上 页 
Bing 索引 | 页 表 早 数量 
CSS 错 试 表单 十 与 率 
Google 后 镍 表单 字段 放 和 并 卒 
Google 索引 播放 时 长 
Google 索引 图 片 产 有 浏览 量 
Google 页 面 排名 产品 转化 府 
HTML 错误 市 品牌 的 搜索 博 可 访问 量 
URM 一 客户 生命 周期 订单 单个 访客 的 访问 量 
URM 一 客户 生命 周期 订单 价值 王孙 
URM 一 客户 生命 周期 访问 量 登录 由 白 分 比 
URM 一 客户 生命 周期 平均 订单 价值 点 击 数 
URM 一 客户 生命 周期 平均 访问 频率 (天) 皮 击 数 (关键 字 ) 
URM 一 客户 生命 周期 页 面 浏览 量 点 击 数 (三 告 ) 
URM 一 客户 生命 周期 折扣 汀 单价 格 
URM 一 客户 生命 a 单 汀 单价 格 (第 一 ， 站 外 ) 
URM 一 客户 生 ne 值 2 格 (多 重 ， 站 外 ) 


URM 一 客户 生命 周期 转化 5 盯 单 价格 (上 一 个 ， 站 外 ) 


AN 


订单 价格 【优先 处 理 ， 站 外 ) 
订单 价格 ( 直接， 站 外 ) 

盯 单 数量 

订单 数量 (第 一 ， 站 外 ) 
订单 数量 (多 重 ， 站 外 ) 
订单 数量 (上 一 个 ， 站 外 ) 
订单 数量 (优先 处 理 ， 站 外 ) 
叮 单数 量 ( 直接， 站 外 ) 

于 弃 的 产品 数量 


访客 ， 回 头 率 百分比 (月 中 
访客 ， 回 头 率 百分比 (月 1) 
访客 ， 回 头 率 百分比 (月 10) 
分 比 (月 11) 
访客 ， 回 法 座 百 分 比 (月 12) 
访客 ， 回 头 认 百分比 (月 分 
访客 ， 回 头 座 百分比 (月 3) 
访客 ， 回 头 率 百分比 (月 省 
访客 ;回头 闪 百 分 比 (月 5) 
访客 ， 回 头 率 百分比 (月 后 
访客 ,回头 率 百 分 比 (月 7) 
访客 ， 回 头 率 百 分 比 (月 久 
访客 ,回头 率 百 分 比 ( 月 9) 
访客 的 表单 数 星 

访客 累计 

访问 量 
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量 百 分 疆 


访问 
访问 量 累计 

访问 数 (营销 活动 ) 
放弃 产品 的 价格 
放弃 的 表单 数量 
付费 访问 

购物 车 的 排名 

联 物 相 放 和 苦 : 
购物 车 添加 率 


-i 
Ll 


关键 条 CTR 
大 键 宁 上 明光 认 


让 ' i 下 
请 于 位 下 


大 键 子 诅 费 
广告 曝光 量 


加 访 访 问 
回访 率 
客户 路 径 的 上 一 个 元 素 
客户 路 径 的 天 数 

累计 订单 价值 (月 0) 
累计 订单 价值 (月 1) 
票 计 订单 价值 (月 10) 
辕 计 订单 价值 (月 11) 
累计 订单 价值 (月 12) 
辕 计 订单 价值 (月 2) 
累计 订单 价值 (月 3) 
浴 计 订单 价值 (月 4) 
累计 订单 价值 (月 5) 
肤 计 订单 价值 (月 6) 
累计 订单 价值 (月 刀 
党 计 订单 价值 (月 
累计 订单 价值 (月 外) 
流程 步骤 数量 
heel 


侠 


二 下 放 中 要 作 数 量 
嵌 体 观看 完成 量 
媒体 运行 时 间 | 


媒体 谨 闻 ] 


媒体 全 节 5 


1 RE 一 = 
峰 坪 章 他 丰 


指 标 指 标 

媒体 章节 了 市 场 活动 成 本 
媒体 章节 8 市 场 活动 成 本 与 营销 关系 百分比 
媒体 章节 9 市 场 活动 单 笔 订单 成 本 
一 斌 坊 问 的 点 击 府 市 场 活动 受众 
年 次 访问 的 页 面 浏 览 量 市 场 活动 投入 / 产 出 比 
每 年 的 独立 访客 市 场 彰 销 话 动 观看 量 
每 天 的 独立 访客 市 场 营 销 活动 交互 度 
每 月 的 独立 访客 市 场 营 销 活 动 有 效 千 次 展示 费用 
每 周 的 独立 访客 搜索 引擎 位 置 
品牌 搜索 百分比 提交 的 表单 数量 
平均 播放 时 长 添加 到 购物 车 的 产品 价格 
平均 订单 价值 (月 0) 添加 到 网 物 车 的 产品 数量 
平均 订单 价值 (月 1) 嘴 出 率 
平均 订单 价值 (月 10 ) 中 出 数 
平均 订单 价值 (月 11) 退出 
平均 订单 价值 (月 12 ) 退出 率 
平均 订单 价值 (月 2) 唯一 网 页 浏览 
平均 订单 价值 (月 3) 唯一 访客 
平均 订单 价值 (月 4) 唯一 浏览 器 
平均 订单 价值 (月 线性 趋势 访客 
平均 订单 价 仁 (月 6) 线性 趋势 访问 量 
平均 订单 价值 (月 7) 新 访客 
平均 订单 价值 (月 8 ) 新 访客 上 比率 (营销 活动 ) 
平均 订单 价值 (月 9) 新 访客 占 比 
平均 购物 得 排名 新 增 访问 量 
平均 浏览 时 长 负面 测 网 数 
平 拘 页 面 浏览 时 长 页 面 浏 览 数 百分比 
平均 营销 活动 生命 周期 的 客户 接触 已 购买 产品 数量 
平均 营销 活动 生命 周期 人 数 已 购买 产品 数量 (第 一 ， 站 外 ) 
平均 运行 时 间 已 购买 产品 数量 (过 
平均 转化 率 已 购买 产品 数量 (上 
平均 转化 前 时 间 已 购买 产品 数量 (优先 处 理 ， 站 外 ) 
评价 订单 价格 已 购买 产品 数量 (直接 ， 站 外 ) 

上 全 化 书签 Delicous 已 购买 产品 总 价 (第 一 ， 站 外 ) 
ee 书签 MR Wong 已 购 洋 产品 总 价 (多 重 ， 站 外 ) 
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2.Adobe Analytics (Sitecatalyst ) 


Adobe Analytics (Sitecatalyst) 默认 报告 列表 如 下 。 
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转化 前 的 小 乓 

转化 之 前 的 位 置 

目 然 访问 百分比 

目 然 访问 量 

目 然 引 厦 访 癌 百 分 比 

目 然 引 和 不 访问 量 

最 大 运行 时 间 百 分 比 

最 后 一 表单 字段 光标 

最 后 一 表单 字段 光标 数量 

支持 100 个 以 上 的 自 定义 指标 ， 支 


特殊 说 明 


一 级 菜单 


性 忱 访问 运 留 时 间 


发 生 事件 之 前 的 逗留 时 间 
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产品 转化 漏斗 
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Adobe Analytics (Sitecatalyst) 默认 指标 如 下 。 


指 标 指 标 


查看 广告 时 间 | 告 缚 来 饮 频 区 段 查 看 次 效 
查看 视频 时 间 收入 

产品 得 看 加 入 购物 车 参与 率 收入 参与 率 

打开 购物 车 术 州 购物 车 商 咒 件数 
登录 瑟 


订单 参与 率 每 日 独特 访客 退出 率 

独立 访客 条 一 会 语 的 长 度 负面 查 看 

访问 删除 的 产品 单价 | 上 

购物 平 金富 删 际 的 产品 件 六 总 人 FE 时 加 

购物 平 浏览 视频 查看 次 效 总 访问 时 间 

广告 查看 视频 结束 支持 自 定 义 指标 100 个 


A.2 Universal Analytics 代 码 部 署 示例 


下 面 以 最 新 的 Universal Ce 介绍 如 何 进行 代码 部 署 ， 有 关 代 码 的 测试 页 面 请 访问 http://www.searchmarketingart.com/test/test_ all.html。Universal Analytics 代 码 部 署 分 两 部 分 : 
第 一 部 分 是 通用 代码 部 署 ， 这 是 实现 页 面 基本 信息 追踪 的 必要 步骤 ; 第 二 部 分 是 自 定 义 代码 部 署 ， 通 过 该 步骤 可 实现 自 定义 维度 、 指 标 、 事 件 以 及 电子 商务 追踪 。 


1. 通 用 代码 部 署 
创建 Google Analytics 账 户 之 后 ， 登 录 进入 系统 界面 。 点 击 顶部 管理 菜单 ， 并 在 下 面 的 配置 选项 中 点 击 媒 体 资 源 中 的 “跟踪 信息 ”， 在 展开 的 菜单 中 点 击 “ 跟 踪 代 码 ”， 如 图 A-1 所 示 。 


首页 。 报告 自 定义 [到]1) 


EL 媒体 资源 
ur 0 


图 帐户 设置 辐 网络 媒 体 资源 设置 


2 用 户 官 理 


轩 AdSense 关联 


平 ” 所 有 过目 器 到 | 


UsSer-ID 
9 更改 历史 记录 全 二 设置 


图 A-1 进入 获取 默认 跟踪 代码 页 面 


完成 以 上 步骤 后 ， 会 到 达 获 取 跟 踪 代码 的 配置 页 面 ， 如 图 A-2 所 示 。 


棕 体 六 | 跟 啼 吕 状态 : 正在 接收 数据 
um “| UA_50808718-1 


同 网络 媒体 资源 设置 网 站 跟踪 


文 星 针 对 此 楷体 资源 的 Universal Analytics 上 中 踪 化 码 。 要 齐 另 发 挥 Universal Analytics 为 此 
ss 用 户 官 理 


5” 有 眼 踪 信息 <Script> 
(‘functiontis.0.9,7a,mNMiGoogleAnalyticsobject]=rilrilr]|iunctionc 其 
中 中 长 码 ii[r].q=itr].allD.pushtarguments hilr]ll=1*new Datetka=s.createElementro,y, 
Ljserp m=s.getElementsByTagNameroNdl.a.asmnec=1.a.src=g.m.parentNode.insertBeforeta,m 
window docurment Script /ww. .google-analytics.com/analytics .Js", ga 
会 话 襄 置 


目 热 搜索 得 
引 存 排除 列表 
搜索 字 词 排 际 列 志 


gafcreate, ‘UA-50808718-1", auto 
gafsend, ‘pageview'y, 


<lscript> 


图 A-2 ”获取 跟踪 代码 页 面 
接 下 来 需要 做 的 就 是 把 这 段 代码 复制 并 粘贴 到 文本 文件 中 ， 直 接 发 送 给 负责 前 端 开 发 的 技术 人 员 ， 计 他 们 在 每 个 页 面 调 用 这 段 代码 即 可 。 
@ 提 示 建议 让 前 端 工程 师 单独 新 建 一 个 JS 文件 作为 通用 代码 段 调用 ， 这 样 在 开发 过 程 中 可 以 避免 由 于 手动 误 操作 等 因素 造成 的 代码 更 改 ， 同 时 这 也 利于 技术 人 员 后 期 的 代码 维护 。 
2. 目 定义 代码 部 署 
(1) 自 定义 事件 追踪 


利用 事件 追踪 功能 可 以 衡量 用 户 与 网 站 内 容 的 互动 情况 ， 常 见 的 事件 包括 按钮 、 下 载 等 动作 。 自 定义 事件 通常 针对 一 个 动作 进行 ， 而 该 动作 在 数据 中 具有 特定 目标 或 意义 。 自 定义 事件 ga 函数 传递 采用 
event 匹 配 类 型 的 send 命 令 ， 代 码 格式 如 下 : 


ga (‘send’, ‘event’, ‘category’, ‘action’, ‘label’, value) ; 


上 述 代 码 中 可 变 参数 包括 四 个 : category、action、label、value， 各 字段 的 含义 如 表 A-1 所 示 。 


表 A-1 自 定义 事件 追踪 参数 说 明 


值 必需 说 明 
Category 股 是 用 户 与 之 互动 的 对 和 象 (例如 ; 按钮 ) 
Action 是 互动 的 区 型 【例如 :点 击 ) 
Label 字符 串 型 否 叮 用 于 给 事件 分 类 (例如 ， 导航 按钮 
Value 交合 型 个 但 不 得 为 员 。 可 用 于 传递 计数 【例如 : 4) 


举例 : 针对 某 个 链接 的 事件 跟踪 ， 只 需要 在 onclick 事 件 引 用 上 述 代码 并 赋值 即 可 ， 其 代码 如 下 。 


<a onclick=“ga (‘send’, ‘event’, ‘Internal Promotions’, ‘click’, ‘Summer Sale’) ; ” href=“#”>Summer Sale</a> 


上 述 代 码 是 针对 一 个 Summer Sale 的 链接 触发 的 事件 追踪 ，Category 是 Internal Promotions; Action 是 click; Label 是 Summer Sale， 无 Value 值 。 
(2) 虚拟 页 面 


虚拟 页 面 是 将 一 个 非 页 面 元 素 当做 页 面 进行 追踪 ， 追 踪 后 的 数据 显示 为 一 个 页 面 。 虚 拟 页 面 和 事件 追踪 都 可 以 针对 按钮 、 下 载 等 做 特定 追踪 ， 不 同 点 在 于 虚拟 页 面 是 在 页 面 报表 中 查看 并 且 会 增加 全 站 
的 PV， 而 事件 追踪 则 会 单独 在 事件 报表 中 查看 ， 对 全 局 数据 没有 影响 。 但 虚拟 页 面 的 特点 是 可 以 实现 某 些 只 有 页 面 级 别 才能 进行 的 分 析 。 例 如 ， 将 某 个 按钮 作为 漏斗 的 一 个 环节 来 分 析 则 只 能 使 用 虚拟 页 
面 。 另 外 ， 虚 拟 页 面 在 使 用 次 数 上 没有 单 次 访问 500 次 的 限制 。 


虚拟 页 面 的 实现 比较 简单 ， 只 需要 在 触发 时 新 增 一 个 onclick 事 件 即 可 ， 示 例 代 码 如 下 : 


<a href=\#” onClick="“ga (‘send’, ‘pageview’,，  \/virtual/testpg17 ) ; “> 虚拟 页 面 1</a> 

在 实际 部 署 时 ，/virtual/testpg1 的 值 根据 具体 场景 定义 即 可 ， 推 荐 单独 增加 一 个 名 为 virtual 的 目录 ， 这 样 便于 后 期 做 数据 筛选 和 分 析 。 
(3) 社交 互动 

利用 社交 互动 分 析 可 以 衡量 用 户 点 击 自己 网 页 上 嵌入 的 社交 按钮 的 次 数 。 例 如 Facebook 上 的 “ 赞 ”。 代 码 格 式 如 下 : 


ga (‘send’, ‘social’, ‘socialNetwork’, ‘socialAction’, ‘socialTarget’, {‘page’: ‘/my-new-page’ }); 


社交 互动 本 质 是 事件 追踪 的 一 种 ， 包 括 四 个 参数 : socialNetwork 是 社交 媒体 名 称 ， 如 微 博 ; socialAction 是 社交 媒体 动作 ， 如 点 赞 ; socialTarget 是 社交 媒体 互动 后 的 目标 ， 如 URL 地 址 或 一 段 文字 信 
息 ; page 变 量 可 以 用 来 记录 这 段 社交 互动 是 在 哪个 页 面 发 生 的 。 完 整 的 实例 代码 如 下 : 


‘social’, ‘socialNetwork’, ‘socialAction’, ‘socialTar 


<a href=\#” onClick=" ga (‘send’, 


(4) 自 定义 页 面 名 称 
Google Analytics 默 认 的 页 面 名 称 是 页 面 Title， 如 果 我 们 要 指定 特定 值 ， 实 现 方 式 有 以 下 两 种 。 


方法 一 : 在 send pageview 函 数 中 指定 title 值 ， 以 下 是 默认 情况 下 的 发 送 代码 段 。 


ga (‘send’, ‘pageview’).; 


通过 修改 代码 段 ， 可 指定 页 面 title， 示 例 代 码 如 下 : 


ga (‘send’, ‘pageview’, {‘title’: ‘This is a title’}).:; 


这 种 方式 是 在 发 送 时 指定 页 面 名 称 ， 其 中 可 变 值 为 代码 中 单 引号 的 部 分 ， 


<Seriet> 
(function (i, s, o, g, r, a, m) {i[‘GoogleAnalyticsObject’]=r; i[r]=i[r]||function () { 
(i[r] .gq=i[r] .gq9||[]) .push (arguments) }, i[r] .1=l*new Date () ; a=s.createElement (o) ， 
m=s .getElementsByTagName (o) [0]; a.async=1; a.src=g; m.parentNode.insertBefore (a, m) 
}) (window, document, ‘script’, ‘// ww.google-analytics.com/analytics.js’, ‘ga’).; 
ga (‘create’, ‘UA-11292629-1’, \auto’); 
ga (‘send’, ‘pageview’, {‘\title’: ‘This is a title’}).; 
</script> 
方法 二 : 通过 set 函 数 指定 title 值 ， 此 时 需要 在 默认 的 代码 中 新 增 以 下 示例 代码 。 
ga (‘set’, ‘title’, ‘This is a title “) ; 
同样 的 ， 上 述 代 码 中 的 This is a title 是 自己 指定 的 名 称 值 ， 完 整 的 代码 示例 如 下 : 
<script> 
(function (i, s, o, g, r, a, m) {i[‘GoogleAnalyticsObject’]=r; i[r]=i[r]||function () { 
(i[r] .gq=i[r] .9||[]) .push (arguments) }, i[r] .1=l*new Date () ; a=s.createElement (o) ， 
m=s.getElementsByTagName (o) [0]; a.async=1; a.src=g; m.parentNode.insertBefore (a, m) 
}) (window, document, ‘script’, ‘// www.google-analytics.com/analytics.js’, ‘ga’).; 
ga (‘create’, ‘UA-11292629-1’, \auto’); 
ga (‘set’, ‘title’, ‘This is a title ’); 
ga (‘send’, ‘pageview’).; 
</script> 


(5) 追踪 用 户 登 录 或 注册 ID 


get’， { ‘page’: ‘/my-new-page’ }) ; “> 社交 活动 示例 页 1</a> 


即 This is a title。 实 际 使 用 时 只 需 将 实际 值 代 替 上 述 示例 值 即 可 ， 完 整 的 代码 示例 如 下 : 


当 用 户 在 网 站 上 发 生 登 录 或 注册 行为 时 ， 可 将 用 户 的 唯一 识别 标识 记录 下 来 ， 这 个 标识 是 用 来 与 线 下 CRM 打 通 的 主键 ,跟踪 实施 方法 有 以 下 两 种 。 


方法 一 : 通过 set 方 法 指定 UserlD 的 值 。 这 种 形式 意味 着 在 跟踪 代码 中 新 增 一 段 代码 用 来 跟踪 用 户 ID， 


ga (‘set’, ‘&uid’, ‘A009022’); 


代码 示例 如 下 。 


上 述 代码 中 的 A009022 即 是 用 户 的 唯一 ID， 该 ID 请 以 实际 用 户 值 为 准 ， 技 术 实施 过 程 中 只 需要 在 用 户 发 生 登录 或 注册 成 功 时 回 传 相应 的 值 来 代 蔡 A009022 即 可 。 完 整 的 代码 示例 如 下 : 


<script> 
(function (i, s, o, g, r, a, m) {i[‘GoogleAnalyticsObject’]=r; i[r]=i[r]||function () { 
(i[r] .gq=i[r] .9||[]) .push (arguments) }, i[r] .1=l*new Date () ; a=s.createElement (o) ， 
m=s.getElementsByTagName (o) [0]; a.async=1; a.src=g; m.parentNode.insertBefore (a, m) 
}) (window, document, ‘script’, ‘// www.google-analytics.com/analytics.js’, ‘ga’).; 
ga (‘create’, ‘UA-11292629-1’, ‘auto’); 
ga (‘set’, ‘&uid’, ‘A009022’),， 
ga (‘send’, ‘pageview’).; 
</script> 


@@is 示 要 在 GA 报表 中 看 到 数据 ， 除 了 部 署 跟踪 代码 ， 还 需要 在 系统 后 侣 配置 中 启用 UserID 功 能 ， 操 作 步 骤 为 : 进入 系统 配置 后 台 ， 依 次 选择 管理 一 媒体 资源 一 跟踪 管理 一 UseftID ， 然 后 根据 提示 完 
成 操作 即 可 。 


方法 二 : 在 创建 对 象 时 指定 UserlD 的 值 。 该 方法 的 示例 代码 如 下 。 


= 


‘UA~40080647-1",， das ID90227” }) ; 


ga (‘create"”, { ‘userI 


上 述 代 码 中 的 1D9022 是 记录 用 户 唯一 ID 的 值 ， 完 整 的 示例 代码 如 下 : 


<script> 
(function (i, s, o, g, r, a, m) {i[‘GoogleAnalyticsObject’]=r; i[r]=i[r]||function () { 
(i[r] .gq=i[r] .9||[]) .push (arguments) }, i[r] .1=l*new Date () ; a=s.createElement (o) ， 
m=s .getElementsByTagName (o) [0]; a.async=1; a.src=g; m.parentNode.insertBefore (a, m) 
}) (window, document, ‘script’, ‘// www.google-analytics.com/analytics.js’, ‘ga’).; 
ga (‘create’, ‘UA-11292629-1’, { ‘userId’: ID9022 }); 
ga (‘send’, ‘pageview’).; 
</script> 


= 


方法 三 : 通过 自 定 义 维度 实现 。 与 方法 一 相似 的 是 ， 当 用 户 登 录 或 注册 成 功 后 ， 同 样 返 回 一 条 记录 用 户 1D 的 自 定义 维度 信息 ， 代 码 示例 如 下 : 


‘dimension3’; ‘ID90002’)，; 


ga (‘set’, 


上 述 代码 中 有 两 个 值 是 需要 根据 部 署 配 置 的 实际 情况 进行 变化 的 。 第 一 个 值 是 dimension3， 该 变量 是 


一 个 自 定 义 维度 ， 这 里 需要 指定 自 定 义 维度 的 序号 ， 依 次 选择 管理 一 媒体 资源 一 自 定 义 定 义 一 自 定 


义 维度 ， 新 建 一 个 针对 用 户 ID 进 行 记录 的 自 定义 维度 。 假 如 这 是 第 三 个 自 定义 维度 ， 那 么 自 定义 变量 名 就 是 dimension 3。 第 二 个 值 是 ID90002， 实 际 应 用 时 以 用 户 真 实 ID 代 蔡 即 可 。 完 整 的 示例 代码 如 


下 : 


<script> 
(function (i, s, o, g, r, a, m) {i[‘GoogleAnalyticsObject’]=r; i[r]=i[r]||function () { 
(i[r] .gq=i[r] .gq9||[]) .push (arguments) }, i[r] .1=1xnew Date () ; a=s.createElement (o) ， 


m=s.getElementsByTagName (o) [0]; a.async=1; a.src=g; m.parentNode.insertBefore (a, m) 
}) (window, document, ‘script’, ‘// www.google-analytics.com/analytics.js’, ‘ga’).; 
ga (‘create’, ‘UA-11292629-1’, \auto’); 
ga (‘set’, ‘dimension3’, ‘ID90002’); 
ga (‘send’, ‘pageview’).; 

</script> 


人 @ 二 示 方法 一 和 方法 二 实现 的 原理 虽然 不 同 ， 但 结果 相同 ， 那 么 到 底 如 何 选择 UserID 呢 ? 还 是 用 自 定 义 维度 实现 用 户 跟踪 ? 当 企 业 只 需要 记录 用 户 ID， 并 把 用 户 的 信息 与 线 下 进行 关联 分 析 时 ， 两 种 
方法 都 可 以 使 用 。 但 如 果 要 启用 Uset_ ID 报表 ， 并 应 用 完整 的 用 户 跨 设备 追踪 和 分 析 时 ， 一 定 要 使 用 Uset ID。UsetrID 的 实施 方法 适用 于 大 多 数 企 业 。 


(6) 增强 的 链接 归 因 
增强 的 链接 归 因 功 能 会 自动 使 用 link 元 素 1D 以 区 别 单 个 页 面 上 指向 相同 网 址 的 多 个 链接 ， 从 而 提高 网 页 内 分 析 报 告 的 准确 性 。 要 启用 增强 的 链接 归 因 ， 需 要 执行 以 下 两 步 操作 。 
第 一 步 : 在 Google Analytics 账 户 的 管理 界面 中 启用 增强 的 链接 归 因 。 依 次 选择 管理 一 媒体 资源 一 网 络 媒体 资源 设置 ， 在 网 页 分 析 中 启用 “使 用 增强 链接 归 因 ” 。 


第 二 步 : 在 页 面 跟 踪 代 码 中 新 增 一 段 “ 增 强 的 链接 归 因 ”代码 ， 其 示例 代码 如 下 。 
ga (‘require’, ‘linkid’, ‘linkid.js’}; 
上 述 代 码 无 须 做 任何 修改 ， 只 需要 添加 到 默认 的 监测 代码 中 即 可 ， 完 整 的 示例 代码 如 下 : 


<script> 

(function (i, s, o, g, r, a, m) {i[‘GoogleAnalyticsObject’]=r; i[r]=i[r]||function () { 
(i[r] .gq=i[r] .gq9||[]) .push (arguments) }, i[r] .1=l*new Date () ; a=s.createElement (o) ， 

m=s .getElementsByTagName (o) [0]; a.async=1; a.src=g; m.parentNode.insertBefore (a, m) 
}) (window, document, ‘script’, ‘// www.google-analytics.com/analytics.js’, ‘ga’).; 
ga (‘create’, ‘UA-11292629-1’, ‘auto’); 
ga ("require’， ‘linkid’， ‘linkid.js’}; // 请 勿 修改 这 段 代码 
ga (‘send’, ‘pageview’).; 

</script> 


(7) 重 命名 全 局 变量 


在 一 些 情况 下 ，9ga 这 个 变量 名 称 可 能 已 经 被 页 面 上 的 某 个 现 有 对 象 占用 。 为 避免 覆盖 现 有 对 象 ， 可 以 重 命名 ga 函数 。 例 如 ， 用 ua 来 代替 ga， 修 改 后 的 完整 代码 如 下 : 


<script> 
(function (i, s, o, g, r, a, m) {i[‘GoogleAnalyticsObject’]=r; i[r]=i[r]||function () { 
(i[r] .gq=i[r] .9||[]) .push (arguments) }, i[r] .1=l*new Date () ; a=s.createElement (o) ， 
m=s.getElementsByTagName (o) [0]; a.async=1; a.src=g; m.parentNode.insertBefore (a, m) 
}) (window, document, ‘script’, ‘// www.google-analytics.com/analytics.js’, ‘ua’).; 
Ua (‘create’, ‘UA-11292629-1’, ‘auto’); 
Ua (‘send’, ‘pageview’); 
</script> 


全 汪 癌 如 果 进 行 了 全 局 对 象 重 命名 ， 网 站 所 有 页 面 中 的 跟踪 代码 都 需要 使 用 新 的 全 局 变量 ， 如 自 定 义 页 面 名 称 、 事 件 追 踪 、 电 子 商 务 追 踪 等 。 因 此 ， 如 果 没 有 特殊 需要 ， 请 勿 修改 全 局 变量 。 
(8) 局 用 受众 特征 和 兴趣 报告 

受众 特征 和 兴趣 报告 可 提供 年 龄 、 性 别 和 兴趣 的 相关 数据 ， 帮 助 你 更 深入 的 了 解 用 户 。 要 查看 这 些 数据 ， 需 要 执行 以 下 两 步 操作 。 

第 一 步 : 在 Google Analytics 账 户 的 管理 界面 中 启用 受众 特征 和 兴趣 报告 。 依 次 选择 管理 一 媒体 资源 一 网 络 媒体 资源 设置 ， 在 适用 于 展示 广告 客户 的 功能 中 启用 “受众 特征 和 兴趣 报告 ”。 


第 二 步 : 在 页 面 跟踪 代码 中 新 增 一 段 “ 受 众 特征 和 兴趣 报告 ”代码 ， 示 例 代 码 如 下 。 
ga (‘require’, ‘displayfeatures’); 
上 述 代 码 无 须 做 任何 修改 ， 只 需要 添加 到 默认 的 监测 代码 中 即 可 ， 完 整 的 示例 代码 如 下 : 


<script> 

(function (i, s, o, g, r, a, m) {i[‘GoogleAnalyticsObject’]=r; i[r]=i[r]||function () { 
(i[r] .gq=i[r] .gq9||[]) .push (arguments) }, i[r] .1=l*new Date () ; a=s.createElement (o) ， 

m=s .getElementsByTagName (o) [0]; a.async=1; a.src=g; m.parentNode.insertBefore (a, m) 
}) (window, document, ‘script’, ‘// ww.google-analytics.com/analytics.js’, ‘ga’).; 
ga (‘create’, ‘UA-11292629-1’, \auto’); 
ga (‘require’， ‘displayfeatures’) ; // 请 勿 修改 这 段 代码 
ga (‘send’, ‘pageview’).; 

</script> 


(9) 普通 电子 商务 追踪 


默认 的 电子 商务 追踪 功能 是 关闭 的 ， 要 实现 对 电子 商务 的 追踪 ， 需 要 首先 启用 该 功能 。 依 次 选择 管理 一 查看 /视图 一 电子 商务 设置 ， 表 启用 电子 商务 即 可 。 在 启用 功能 的 基础 上 ， 还 需要 在 页 面 中 添加 相 
应 的 追踪 代码 才能 完整 实现 该 功能 。 


Google Analytics 的 电子 商务 追踪 分 为 以 下 四 个 步骤 。 


第 一 步 : 加 载 电 子 商 务 插件 ， 调 用 以 下 代码 。 


ga (‘require’, ‘ecommerce’, ‘ecommerce.js’); // 此 代码 无 须 修改 


全 尘 意 代码 的 位 置 在 创建 跟踪 器 对 象 之 后 ， 在 使 用 其 他 与 电子 商务 相关 的 具体 功能 之 前 执行 。 追 踪 对 象 即 为 默认 代码 中 create 代 码 段 的 内 容 。 


第 二 步 : 添加 交易 代码 ， 示 例 代码 如 下 : 


ga (‘ecommerce: addTransaction’, { 
Wid’; “1234’; // 订单 ID， 必 填 ， 字 符 串 型 
‘affiliation’ ‘Acme’, // 发 生 此 交易 的 高 店 或 联 属 机 构 ， 选 填 ， 字 符 串 型 
‘revenue’: \11.997, // 订单 收入 ， 选 填 ， 货 币 型 
‘shipping’: ‘5’, // 运费 ， 选 填 ， 货 币 型 
‘tax’: ‘1.29’ // 税 ， 选 填 ， 货 币 型 


}); 


注意 上 述 变量 中 的 收入 指 的 是 订单 收入 ， 计 算 公式 为 : 商品 金额 + 运费 (如 果 有 ) -优惠 券 (如 果 有 ) 。 变 量 值 请 以 实际 交易 数据 填 入 。 


第 三 步 : 添加 商品 代码 ， 示 例 代码 如 下 。 


ga (‘ecommerce: aqqItem'， { 


‘id’: ‘1234", // 订单 ID， 必 填 ， 字 符 串 型 
‘name’: ‘Fluffy Pink Bunnies’, // 商品 名 称 ， 必 填 ， 字 符 串 型 
‘sku’: ‘DD23444’, // 商品 SKU， 选 十， 字符 串 型 
\category': ‘Party Toys’, // 商品 类 别 ， 选 填 ， 字 符 串 型 
\price’: ‘11.99’, // 商品 单价 ， 选 填 ， 货 币 型 
‘quantity’: ‘1’ // 数量 ， 选 填 ， 数 值 型 


}); 


合 尘 总 上 述 变 量 中 的 数量 请 使 用 整数 数值 ， 如 果 存 在 数量 为 类 似 1.5 的 值 请 根据 实际 情况 确定 填 入 1 或 者 2， 大 多 数 情 况 下 应 该 四 售 五 入 。 变 量 值 请 以 实际 交易 数据 填 入 。 


第 四 步 : 发 送 数据 ， 示 例 代码 如 下 。 


ga (‘ecommerce: send’ ) ; // 请 勿 修改 此 代码 


名 沪 订单 信息 和 商品 信息 通常 一 起 发 送 ， 但 也 可 以 只 发 送 商品 信息 或 订单 信息 。 一 个 购物 车 中 若 有 多 个 不 同 商品 的 情况 下 ， 每 个 商品 需要 单独 输出 一 段 代 码 。 


上 述 示例 代码 通常 当 用 户 提交 订单 时 ， 在 订单 提交 成 功 页 上 返回 以 实现 对 用 户 订单 的 追踪 。 其 完整 代码 如 下 : 


<Script> 
(function (i, s, o, g, r, a, m) {i[‘GoogleAnalyticsObject’]=r; i[r]=i[r]||function () { 
(i[r] .gq=i[r] .9||[]) .push (arguments) }, i[r] .1=l*new Date () ; a=s.createElement (o) ， 
m=s.getElementsByTagName (o) [0]; a.async=1; a.src=g; m.parentNode.insertBefore (a, m) 
}) (window, document, ‘script’, ‘// www.google-analytics.com/analytics.js’, ‘ga’); 
ga (‘create’, ‘UA-11292629-1’, \auto’); 
ga (‘send’, ‘pageview’); 
// 调用 电子 商务 插件 
ga (‘require’， ‘ecommerce’， ‘ecommerce.js’) ; // 此 代码 无 须 修改 
// 添加 交易 信息 


ga (‘ecommerce: addTransaction’, { 

‘id’; “1234’, // 订单 ID， 必 填 ， 字 符 串 型 

‘affiliation’: ‘Acme’, // 发 生 此 交易 的 商店 或 联 属 机 构 ， 选 填 ， 字 符 串 型 
‘revenue’: ‘11.99’, //_ 订 单 收 入 ， 选 填 ， 货 币 型 

‘shipping’: ‘5’, // 运费 ， 选 填 ， 货 币 型 

‘tax’: ‘1.29’ // 税 ， 选 填 ， 货 币 型 

}) ; 


// 添加 第 一 个 商品 信息 


ga (‘ecommerce: aqqItem'， { 


‘id’: ‘1234’, // 订单 ID， 必 填 ， 字 符 串 型 
\name’: ‘T-shirt-M1’, // 商品 名 称 ， 必 填 ， 字 符 串 型 
‘sku’: ‘DA1234’, // 商品 SKU， 选 填 ， 字 符 串 型 
\category’: 、T-shirt ‘, // 商品 类 别 ， 选 十， 字符 串 型 
‘price’: ‘18’, // 商品 单价 ， 选 填 ， 货 币 型 
‘quantity’: ‘2’ // 数量 ， 选 填 ， 数 值 型 

}) ; 

// 添加 第 二 个 商品 信息 

ga (‘ecommerce: agddItem’, { 

‘id's “43217, // 订单 ID， 必 填 ， 字 符 串 型 
\name’: ‘Fluffy Pink Bunnies’, // 商品 名 称 ， 必 填 ， 字 符 串 型 
‘sku’: ‘DD23444’, // 商品 SKU， 选 填 ， 字 符 串 型 
\category’: ‘Party Toys’, // 商品 类 别 ， 选 十， 字符 串 型 
\price’: ‘11.99’, // 商品 单价 ， 选 填 ， 货 币 型 
‘quantity’: \1’ // 数量 ， 选 填 ， 数 值 型 


}) ; 

// 发 送 交 易 信息 

ga (‘ecommerce: send' ) ; // 请 勿 修改 此 代码 
</script> 


(10) 增强 型 电子 商务 追踪 
在 最 新 升级 的 Universal Analytics 版 本 中 ， 电 子 商 务 追踪 功能 提升 到 一 个 新 的 高 度 一 一 它 不 仅 可 以 追踪 到 更 丰富 的 用 户 订单 信息 ， 还 能 针对 电子 商务 的 过 程 进行 跟踪 。 
增强 型 电子 商务 追踪 需要 先 在 系统 后 台 配 置 启用 电子 商务 跟踪 的 基础 上 ， 启 用 增强 型 电子 商务 报告 。 依 次 选择 管理 一 查看 /视图 一 电子 商务 设置 ， 再 选择 启用 即 可 。 


启用 增强 型 电子 商务 报告 后 ， 在 代码 实施 时 需要 先 调用 电子 商务 插件 ， 其 代码 如 下 : 


ga (‘require’, ‘ec’); 


+ 总 代码 的 位 置 在 创建 跟踪 器 对 象 之 后 ， 在 使 用 其 他 与 电子 商务 相关 的 具体 功能 之 前 执行 。 跟 踪 对 象 即 上 默认 代码 中 create 代 码 段 的 部 分 
在 调用 增强 型 电子 商务 插件 之 后 ， 接 下 来 需要 针对 不 同 的 场景 和 功能 分 别 调用 不 同 的 代码 。 
. 站 内 促销 活动 的 浏览 跟踪 。 


当 站 内 促销 活动 页 面 进行 加 载 时 ， 触 友 以 下 示例 代码 : 


ga (‘ec: addPromo’, { 


\id’: ‘PROMO 12347， // 促销 ID 
‘name’: '`\ 夏 日 周年 庆 ’， // 促销 活动 名 称 
‘creative’: 创意 27， // 促销 创意 
\position’: ‘hp’ // 促销 位 置 ， 首 页 


}); 


页 面 中 的 完整 跟踪 示例 代码 如 下 : 


<script> 
(function (i, s, o, g, r, a, m) {i[‘GoogleAnalyticsObject’]=r; i[r]=i[r]||function () { 
(i[r] .gq=i[r] .9||[]) .push (arguments) }, i[r] .1=l*new Date () ; a=s.createElement (o) ， 
m=s .getElementsByTagName (o) [0]; a.async=1; a.src=g; m.parentNode.insertBefore (a, m) 
}) (window, document, ‘script’, ‘// www.google-analytics.com/analytics.js’, ‘ga’).; 
ga (‘create’, ‘UA-11292629-1’, ‘auto’); 
ga (‘require’, ‘ec’).; 
ga (‘ec: addPromo’, { 


\id’: ‘PROMO 12347， // 促销 ID， 必 填 
‘name’: '\ 夏 日 周年 庆 ’， // 促销 活动 名 称 ， 必 填 
creative : 创意 27， // 促销 创意 ， 选 填 
‘position’: \hp’ // 促销 位 置 ， 首 页 ， 选 填 


ga 人 ‘send’, ‘pageview’); 
</script> 


“ 站 内 促销 活动 的 点 击 跟 踪 。 


当 站 内 促销 资源 被 用 户 点 击 时， 通常 使 用 onclick 事 件 触 发 ， 并 通过 函数 进行 调用 ， 完 整 的 示例 代码 如 下 : 


// 定义 一 个 名 为 onPromotionCc1lick 的 函数 体 ， 便 于 触发 onclLick 事 件 时 调用 


<script> 
function onPromotionClick () 


{ 


ga (‘ec: addPromo’, { 
\id’: ‘PROMO 1234’, // 促销 ID， 必 填 
\name’: '" 夏 日 周年 庆 "， // 促销 活动 名 称 ， 必 填 
\creative’: 创意 27， // 促销 创意 ， 选 填 
0 \hp’ // 促销 位 置 ， 选 填 
} 
ga (‘ec: setAction’, ‘promo click’); 
ga (\'send’， ‘event’， `\ 内 部 促销 '， ` 点 击 '/”， “ 夏 日 周年 庆 ' ) ;”// 动作 级 别 使 用 事件 发 送 
} 
</script> 
http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15089/OEBPS/Text/...// 页 面 其 他 代码 
<a onclick=“onPromotionClick() ; “href="\#”> 促 销 活动 点 击 1</a> 
http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15089/OEBPS/Text/...// 页 面 其 他 代码 
全 注 言 上 述 代 码 中 的 函数 定义 部 分 ， 新 增 了 setAction 指 定 动作 类 型 ， 并 通过 事件 的 形式 发 送 数 据 。 
' 商品 列表 页 浏览 跟踪 。 
当 商品 在 列表 页 加 载 时 ， 可 单独 调用 一 段 代码 来 监测 列表 页 的 详细 信息 ， 示 例 代 码 如 下 : 
ga (‘ec: addImpression’, { 
‘jd; “Pl2345; // 商品 ID， 必 填 
name' : 苹果 5S 智 能 手机 ?， / 商品 名 称 ， 必 填 
‘category’: 手机 7， // 商品 类 别 ， 选 填 
‘prand’: “苹果” // 商品 品牌 ， 选 填 
‘variant’: ,黑色 ，， // 商品 属性 ， 选 填 
‘list’: \ 手 机 列表 页 ”， // 商品 列表 ， 选 填 
\position’: 1， // 商品 位 置 (0 选 填 
‘dimension1’: 会 员 / // 自 定义 维度 1， 选 填 
}) ; 
其 完整 的 示例 代码 如 下 : 
<script> 
(function (i, s, o, g, r, a, m) {i[‘GoogleAnalyticsObject’]=r; i[r]=i[r]||function () { 
(i[r] .gq=i[r] .9||[]) .push (arguments) }, i[r] .1=l*new Date () ; a=s.createElement (o) ， 
m=s.getElementsByTagName (o) [0]; a.async=1; a.src=g; m.parentNode.insertBefore (a, m) 
}) (window, document, ‘script’, ‘// ww.google-analytics.com/analytics.js’, ‘ga’).; 
ga (‘create’, ‘UA-11292629-1’, ‘auto’); 
ga (‘require’, ‘ec’).; 
ga (‘ec: addImpression’, { 
Wd’:s ‘P123495’; // 商品 ID， 必 填 
name' : “苹果 5S 智 能 手机 "， // 商品 名 称 ， 必 填 
"category': 手机"， // 商品 类 别 ， 选 填 
\brand' : 苹果 '， // 商品 品牌 ， 选 填 
‘variant’: 黑色/， // 商品 属性 ， 选 填 
‘list’: \ 手 机 列表 页 ，， // 商品 列表 ， 选 填 
‘position’: 1, y 商品 位 置 ( 数 值 型 ，， 选 十， 注意 没有 单 引 号 
‘dimension1’: “会 员 " / 自 定义 维度 1， 选 填 ， 页 面 中 可 以 设置 其 他 自 定义 
、 // 维度 和 和 自 定 色 指标 
}); 
ga (‘send’, ‘pageview’).; 
</script> 
. 商品 列表 页 点 击 跟踪 。 
当 商 品 在 列表 页 被 点 击 时 ， 可 单独 调用 一 段 监 测 额 外 信息 的 程序 ， 其 完整 的 示例 代码 如 下 : 
// 定义 一 个 名 为 onProductClick 函 数 ， 便 于 在 onclick 触 发 时 调用 
<script> 
function onpProductClick () { 
ga (‘ec: addImpression’, { 
id’:s ‘Pl2345”; // 商品 ID， 必 填 
‘name’: \ 苹 果 5S 智 能 手机 ”， // 肴 品名 称 ， 必 填 
‘category’: ` 手 机 "， // 商品 类 别 ， 选 填 
‘brang’: ' 蕴 果 直 // 商品 品牌 ， 选 填 
‘variant’: 黑色 "， // 商品 属性 ， 选 填 
\1ist': 手机 列表 页 "， // 商品 列表 ， 选 填 
\position’: 1， // 商品 位 置 〈 数 值 型 ) ， 选 填 ， 注 意 没 有 单 引号 
‘dimension1’: 会 员 / // 自 定义 维度 1， 选 填 
}) ; 
ga (\ec: setAction’, ‘click’, { 
\ 手 机 列表 页 
}) ; 
a (\'send’， ‘event’， 手机 列表 页 /， ` 点 击 “"， \ 苹 果 5S 智 能 手机 和 ) ; 
// 动作 级 别 使 用 事件 发 送 
} 
</script> 
http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15089/OEBPS/Text/...// 页 面 其 他 代码 
<a onclick=“onProductClick() ; ”href="#”> 列 表 页 商品 A</a> 
http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15089/OEBPS/Text/...// 页 面 其 他 代码 


全 尘 意 上 述 代码 中 setAction 指 定 了 动作 类 型 为 cick， 列 表 页 名 称 为 手机 列表 页 ， 动 作 事件 类 型 与 站 内 促销 活动 追踪 是 不 同 的 。 


` 商品 页 浏览 跟踪 。 


当 商 品 被 浏览 时 (商品 详情 页 ) 


， 可 单独 调用 一 段 监测 代码 获取 更 多 信息 ， 代 码 示例 如 下 : 


ga (‘ec: addProduct’, { 
‘id’: ‘P12345’, // 商品 ID， 必 十 
\name’: ‘Android Warhol T-Shirt’”, // 商品 名 称 ， 必 填 
\category': ‘Apparel’, // 商品 类 别 ， 选 填 
\brand’: ‘Google’, // 商品 品牌 ， 选 填 
‘variant’: ‘black’ // 商品 属性 ， 选 填 
}) ; 
ga (‘ec: setAction’, ‘detail’).; 
完整 的 示例 代码 如 下 : 
<script> 
(function (i, s, o, g, r, a, m) {i[‘GoogleAnalyticsObject’]=r; i[r]=i[r]||function () { 
; d=S .createElement (Oo) ， 


gq=i[r] .9||1[]) .push (arguments) }, i[r] .1=l*new Date ().; 


(Ea 
m=s .getElementsByTagName (o) [0]; a.async=1; a.src=g; m.parentNode.insertBefore (a, m) 
}) (window, document, ‘script’, ‘// ww.google-analytics.com/analytics.js’, ‘ga’).; 
ga (‘create’, ‘UA-11292629-1’, ‘auto’); 
ga (‘require’, ‘ec’).; 
ga (‘ec: addProduct’, { 
‘ijd’: ‘P12345’, // 商品 ID， 必 填 
‘name’: ‘Android Warhol T-Shirt’, // 商品 名 称 ， 必 填 
\category’: ‘Apparel’, // 商品 类 别 ， 选 填 
\brand’: ‘Google’, // 商品 品牌 ， 选 填 
// 商品 属性 ， 选 填 


‘variant’: 


‘black’” 


}) ; 

ga (‘ec: setAction’, ‘detail’); 
ga (‘send’, ‘pageview’).; 

</script> 


四 注意 


“ 商品 加 入 购物 车 追踪 。 


上 述 代码 中 setAction 的 值 为 detail， 动 作 事件 类 型 与 站 内 促销 活动 、 商 品 在 列表 


当 商 品 被 加 入 购物 车 时 ， 有 以 下 两 种 方式 可 追踪 加 入 购物 车 的 商品 信息 。 


方法 一 : 在 商品 页 加 入 购物 车 的 按钮 上 加 监测 代码 ， 通 过 onclick 触 发 ， 完 整 的 示例 代码 如 下 。 


个 addToCart 函 数 ， 便 于 发 生 onclick 时 调用 


// 定义 一 
<Script> 
function addToCart (product) { 

ga (‘ec: addProduct’, { 

‘id’: ‘P12345’， // 商品 ID， 必 填 


‘name’: ‘Android Warhol T-Shirt’, // 商品 名 称 ， 必 填 
\category': ‘Apparel’, // 商品 类 别 ， 选 填 
\brand’: ‘Google’, // 商品 品牌 ， 选 填 
‘variant’: ‘black’, // 商品 属性 ， 选 填 
‘price’: ‘888’, // 商品 单价 ， 选 填 
‘quantity’: ‘1’ // 商品 数量 ， 选 填 


}) ; 


ga (\ec: setAction’, ‘add’); // 注意 setaction 的 值 设 置 为 add 


ga (‘send’, ‘event’, ` 加 入 购物 车 '， “商品 详情 页 '"， 立即 购买 +) ; // 动作 级 别 使 用 事件 发 送 
} 

</script> 

// 页 面 其 他 代码 


="#“> 加 入 购物 车 </a> 


<a onclick=“addToCart () ; “” href 


http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15089/OEBPS/Text/...// 页 面 其 


方法 二 : 当 商 品 加 入 购物 车 并 到 达 我 的 购物 车 页 面 时 ， 加 载 加 入 购物 车 跟踪 代码 ， 


<script> 

(function (i, s, o, g, r, a, m) {i[‘GoogleAnalyticsObject’]=r; i[r]=i[r]||function () { 
(i[r] .gq=i[r] .9||[]) .push (arguments) }, i[r] .1=l*new Date () ; a=s.createElement (0o), 

m=s.getElementsByTagName (o) [0]; a.async=1; a.src=g; m.parentNode.insertBefore (a, m) 


\// ww.google-analytics.com/analytics.js’, ‘ga’).; 


‘auto’); 


}) (window, document, ‘script"’, 
ga (‘create’, ‘UA-11292629-1’, 
ga (‘require’, ‘ec’).; 
ga (‘ec: addProduct’, { 
‘ijd’: ‘P12345’, 


// 商品 ID， 必 填 


‘name’: ‘Android Warhol T-Shirt’, // 商品 名 称 ， 必 填 
\category’: ‘Apparel’, // 商品 类 别 ， 选 填 
\brand’: ‘Google’, // 商品 品牌 ， 选 填 
‘variant’: ‘black’, // 商品 属性 ， 选 填 
‘price’: ‘888’, // 商品 单价 ， 选 填 
‘quantity’: ‘1’ // 商品 数量 ， 选 填 


] ) ; 
ga (‘ec: setAction’, ‘add’); 
ga (‘send’, ‘pageview’).; 
</script> 


全 注 总 上 述 代码 中 setAction 的 值 为 add， 动作 事件 类 型 与 站 内 促销 活动 、 商 品 在 列表 页 的 点 击 、 商 品 页 沪 


重复 触发 。 


当 用 户 到 页 面 时 ， 默 认 加 载 以 下 完整 的 示例 代码 : 


<Script> 


(function (i, s, o, g, r, a, m) {i[‘GoogleAnalyticsObject’]=r; i[r]=i[r]||function () { 
a=s .createEglement (Oo) ， 


.q=i[r] .gq||[]) .push (arguments) }, i[r] .1=l*new Date (); 

a.async=1; a.src=g; m.parentNod 
\// ww.google-analytics.com/analytics.js’, 
\auto’); 


(i[r] 
m=s .getElementsByTagName (o) [0]; 

}) (window, document, ‘script"’, 

ga (‘create’, ‘UA-11292629-1’, 

ga (‘require’, ‘ec’).; 

// 输出 商品 1 信息 

ga (‘ec: addProduct’, { 


.insertBefore (a, m) 
‘ga’ ) ; 


\id’: ‘P12345’, // 商品 ID， 必 填 
‘name’: ‘Android Warhol T-Shirt’, // 商品 名 称 ， 必 填 
\category': ‘Apparel’, // 商品 类 别 ， 选 填 
\brand’: ‘Google’, // 商品 品牌 ， 选 填 
‘variant’: ‘black’, // 商品 属性 ， 选 填 
‘price’: ‘888’, // 商品 单价 ， 选 填 
‘quantity’: ‘1’ // 商品 数量 ， 选 填 


}) ; 
// 输出 商品 2 信息 
ga (‘ec: addProgduct’, { 


\id’: “P66666’, // 商品 ID， 必 填 
\name’: ‘Toys’, // 商品 名 称 ， 必 填 
\category': ‘Tes’, // 0 选 填 
‘brand’: ‘Baidu’, / 商品 品牌 ， 选 填 
‘variant’: ‘XXL’, 2 / 商品 属性 ， 选 填 
\price’: ‘666’, 2 商品 单价 ， 选 填 
‘quantity’: ‘2’ / 商品 数量 ， 选 填 


]) ; 
ga (‘ec: setAction’, ‘checkout’); 
ga (‘send’, ‘pageview’).; 
</script> 


四 注意 和 


当 用 户 完 成 结算 第 一 步 


// 指定 setAction 值 为 checkout 


果 购 物 车 中 有 多 个 商品 ， 需 要 单独 输出 每 一 个 商品 的 代码 。 


(例如 确认 个 人 收 货 信息 ) ， 单 击 “ 确 认 ” 按 钮 时 会 触发 以 下 代码 : 


// 定义 一 个 名 为 onCheckout2 的 函数 ， 发 生 点 击 事件 时 调用 
<script> 
function onCheckOut2 () { 
ga (‘ec: addProduct’, { 
Vid “PI2345’, 


‘name’ ‘Android Warhol T-Shirt’, 
‘category’ ‘Apparel’, 

‘brand’ ‘Google’, 

‘variant’ ‘black’, 

‘price’ ‘888"， 

‘quantity!’ V3 


ga (‘ec: setAction’, ‘checkout’, { 
‘step’: 1, 
‘option’: “\ 确 认 个 人 信息 
}) ; 


// 步 又， 注意 没 有 单 引号 
// 步 又 名 称 


~ 


}; 
ee 
// 页 面 3 


其 他 代码 


完整 的 示例 代码 如 下 。 


页 的 点 击 设置 都 不 同 。 


1 览 设 


其 他 代码 


置 都 不 同 。 每 个 商品 在 加 入 购物 车 后 


只 发 送 本 次 


数据 ， 已 经 加 入 购物 车 的 商品 代码 无 须 


<a onclick= vonCcheckout2 () ; ”nref="#”> 确 认 个 人 信息 </a> 
http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15089/OEBPS/Text/...// 页 面 其 他 代码 


人 @ 渡 结算 页 面 上 的 按钮 大 多 是 JS 或 其 他 形式 ， 实 施 原理 相同 。 


按照 相同 的 思路 ， 当 用 户 完 成 结算 第 二 步 ， 例 如 选择 配送 方式 时 ， 上 述 代 码 中 的 step 值 应 设置 为 2，option 值 应 该 改 为 用 户 选 送 方 式 ， 例 如 顺丰 快递 ; 当 用 户 完 成 第 三 步 ， 例 如 支付 方式 选择 
时 ，step 值 应 设置 为 3，option 值 应 该 改 为 用 户 选择 的 支付 方式 。 


但 实施 以 上 代码 还 不 够 ， 为 了 能 够 细 分 结算 每 个 步骤 的 分 析 数 据 ， 在 系统 配置 中 需要 做 出 相应 的 设置 。 依 次 选择 管理 一 查看 /视图 一 电子 商务 设置 ， 在 标记 记 账 步骤 中 设置 相应 的 步骤 名 称 即 可 。 如 图 A- 
3 所 示 为 设置 好 的 三 个 步骤 


标记 结账 步骤 可 碗 
为 您 在 电子 商务 跟踪 代码 中 确 结 帐 渠道 步 又 创建 标签 。 由 于 这 些 标签 将 显示 在 您 的 报告 中 请 使 用 直 
观 、 易 于 理解 的 名 称 。 


当道 步 


:; 个 人 信息 确认 


选择 本 还 方式 


选择 支付 方式 


瀛 加 染 审 步 轰 


. 订单 提交 页 面 追踪 。 


当 用 户 提交 订单 并 返回 订单 成 功 页 时 ， 返回 一 段 完 整 的 监测 代码 ， 其 示例 代码 如 下 : 


<script> 
(function (i, s, o, g, r, a, m) {i[‘GoogleAnalyticsObject’]=r; i[r]=i[r]||function () { 
(i[r] .gq=i[r] .9g9||[]) .push (arguments) }, i[r] .1=l*new Date () ; a=s.createElement (o) ， 
m=s.getElementsByTagName (o) [0]; a.async=1; a.src=g; m.parentNode.insertBefore (a, m) 
}) (window, document, ‘script’, ‘// www.google-analytics.com/analytics.js’, ‘ga’).:; 
ga (‘create’, ‘UA-11292629-1’,， ‘auto’); 
ga (‘require’, ‘ec’).; 
// 输出 商品 1 数据 
ga (‘ec: addProduct’, { 


‘id’: ‘P12345’, // 商品 ID， 必 填 
‘name’: ‘Android Warhol T-Shirt’, // 商品 名 称 ， 必 填 
\category’: ‘Apparel’, // 商品 类 别 ， 选 填 
\brand’: ‘Google’, // 商品 品牌 ， 选 填 
‘variant’: ‘black’, // 商品 属性 ， 选 填 
\price’: ‘888’, // 商品 单价 ， 选 填 
‘quantity’: ‘1’ // 商品 数量 ， 选 填 


}) ; 
// 输出 商品 2 数据 
ga (‘ec: addProgduct’, { 


\id’: ‘P66666’, // 商品 ID， 必 填 
\name’: ‘Toys’, // 商品 名 称 ， 必 填 
\category’: ‘Tes’, // 商品 类 别 ， 选 填 
‘brand’: ‘Baidu’, 1 商品 品牌 ， 选 填 
‘variant’: ‘XXL’, / 商品 属性 ， 选 填 
\price’: ‘666’, // 《条 品 单价 选 填 
‘quantity’: ‘2’ // 商品 数量 ， 选 填 
] ) ; 

// 输出 订单 数据 

ga (‘ec: setAction’, ‘purchase’, { 
‘ja "T12345" // 订单 ID 
\affiliation’: // 所 属 店 销 或 商品 归属 
‘revenue’: ‘37.39’, // 订单 收入 
‘tax’: ‘2.85’, // 税 
‘shipping’: '5.34’, // 运费 
‘coupon’: ‘SUMMER2013’ // 优惠 券 代 码 


}); 
ga (‘send’, ‘pageview’).; 
</script> 


到 此 为 止 ， Google Analytics 的 常用 代码 部 署 已 经 完成 ， 以 上 设置 和 追踪 实施 的 方法 可 以 满足 绝 大 多 数 企 业 的 需求 ， 针 对 网 站 的 数据 采集 和 分 析 工 作 已 经 可 以 正常 开展 了 。 更 多 关于 Google Analytics 
的 部 署 和 实施 问题 ， 请 参照 Google 官 方 实施 帮 助 中 心 https://developers.google.com/analytics/devguides/collection/analyticsjs/advanced， 推 荐 读者 在 英文 网 站 进行 查看 ， 中 文 网 站 有 时 候 翻 译 不 准 
确 并 且 新 增 功能 的 翻译 资料 更 新 不 够 及 时 。 


附录 B 企业 网 站 数据 工作 的 局 限 与 友 展 


本 书 围绕 着 企业 网 站 数据 工作 方向 的 相关 话题 进行 了 探讨 ， 在 看 到 其 应 用 价值 的 同时 ， 我 们 也 看 到 网 站 数据 工作 价值 的 发 挥 仍 面临 非常 大 的 局 限 性 ， 在 此 我 们 会 进行 总 结 。 同 时 ， 作 为 互联 网 领域 的 从 
业者 ， 跟 大 家 谈 谈 我 所 理解 的 网 站 数据 甚至 整个 数据 工作 未 来 的 发 展 方向 。 


B.1 网 站 数据 工作 的 局 限 性 


1. 价 值 局 限 性 
网 站 数据 工作 的 价值 需要 从 投入 和 产 出 两 方面 综合 衡量 。 
从 价值 回报 来 看 ， 网 站 数据 工作 的 产 出 价值 有 限 ， 主 要 表现 在 以 下 三 个 方面 : 


* 网 站 数据 中 的 大 多 数 数 据 都 是 匿名 数据 ， 除 了 做 分 析 应 用 ， 这 些 数据 仅仅 能 结合 Cookie 做 用 户 定位 和 信息 推荐 ， 且 由 于 Cookie 的 特殊 性 以 及 用 户 行为 数据 的 生命 周期 太 短 等 原因 ， 数据 的 应 用 价值 
不 大 。 


. 网 站 数据 工作 的 本 质 是 针对 用 户 的 分 析 ， 业 务 落 地 点 主要 是 营销 、 运 营 和 用 户 研究 。 但 从 企业 的 整个 价值 链 来 看 ， 首 先 关 注 的 是 对 订单 销售 的 研究 ， 其 次 才 会 分 解 到 流量 和 用 户 的 研究 。 因 此 ， 在 大 
多 数 企业 中 网 站 数据 工作 都 距 “ 现 金 流 ”业务 较 远 ， 不 属于 核心 数据 圈 。 


. 网 站 数据 只 是 企业 数据 的 一 部 分 ， 而 企业 数据 只 是 企业 所 有 运营 环节 的 一 部 分 。 数 据 到 底 对 企业 有 多 大 的 存在 价值 ? 而 网 站 数据 对 企业 又 有 多 大 贡献 ? 这 些 问题 值得 深思 。 
从 成 本 投入 来 看 ， 网 站 数据 的 采集 、 处 理 、 分 析 和 应 用 都 比 传统 结构 化 数据 复杂 ， 这 需要 企业 的 IT 部 门 和 数据 工作 投入 更 多 的 人 力 、 物 力 、 财 力 和 时 间 成 本 。 


例如 ， 一 天 的 流量 数据 可 能 有 1 亿 条 记录 ， 而 有 用 户 信息 的 数据 可 能 只 有 200 万 条 ， 有 订单 信息 的 数据 记录 可 能 只 有 100 万 条 。 对 企业 来 讲价 值 最 大 的 是 订单 数据 ， 其 次 是 用 户 数据 ， 最 后 才 是 流量 数 
据 。 同 样 时 间 的 存储 资源 投入 ， 流 量 数据 投入 成 本 比 用 户 和 订单 数据 投入 成 本 要 高 5~ 10 倍 。 如 果 再 考虑 到 其 他 数据 工作 的 机 会 成 本 ， 衡 量 的 结果 是 流量 数据 工作 成 本 投入 比 其 他 数据 的 成 本 投入 (例如 ERP 
等 ) 大 很 多 。 


D 


综合 考虑 价值 回报 和 成 本 投入 关系 ， 我 们 会 发 现 网 站 数据 工作 的 价值 效率 不 高 ， 同 等 条 件 下 如 果 把 资源 投入 其 他 数据 工作 上 其 机 会 成 本 会 小 很 多 ， 这 也 直接 限制 了 企业 对 网 站 数据 工作 价值 的 认可 度 。 
2. 认 知 局 限 性 
国内 企业 对 网 站 数据 工作 的 认 知 存在 很 大 的 局 限 性 ， 大 多 数 企业 过 度 重 视 工 具 ， 而 忽略 了 网 站 分 析 的 价值 存在 。 例 如 : 

过 于 重视 工具 的 性 能 而 非 使 用 者 水 平 。 如 果 网 站 分 析 工 作价 值 产 出 较 小 ， 大 多 数 企 业 的 第 一 想法 是 换 工 具 ， 而 不 是 提升 工具 使 用 者 的 技能 和 水 平 。 


* 服务 价值 的 认可 度 较 低 。 企 业 硕 望 获得 免费 服务 的 心态 无 可 厚 非 ， 但 真正 有 价值 的 服务 一 定 是 付费 的 。 不 愿 付 费 的 习惯 直接 影响 了 国内 第 三 方 服务 公司 的 专业 发 展 ， 间 接 的 影响 了 网 站 数据 工作 者 的 


从 业 意 识 。 
. 大 多 数 企 业 贪图 大 而 全 的 功能 ， 而 对 小 而 美的 工具 认可 度 较 低 。 每 个 网 站 数据 工具 都 具有 自己 的 特性 ,但 国内 企业 普通 希望 购买 一 种 “万 能 ”工具 ， 这 使 得 数据 工具 及 相应 服务 的 专业 性 发 展 不 足 。 


` 对 于 数据 从 业者 而 言 ， 大 多 数 都 在 谈论 工具 本 身 的 部 署 和 实施 ， 而 对 于 商业 作用 的 理解 程度 较 低 。 仅 仅 使 用 下 钻 、 趋 势 和 转化 很 难 发 现 深层 次 的 数据 价值 ， 网 站 数据 要 有 更 进一步 的 价值 提炼 ， 必 须 
结合 数据 挖 据 、 机 器 学 习 、 商 业 智 能 甚至 大 数据 量 的 工作 方法 才能 实现 。 否 则 ， 网 站 数据 工作 只 能 停留 在 做 网 站 数据 统计 的 阶段 上 。 


3. 技 术 局 限 性 

众所周知 ， 网 站 数据 工作 的 基本 原理 是 通过 Cookie 采 集 用 户 访问 信息 ， 这 一 机 制 具有 非常 明显 的 局 限 性 。 
删除、 清空 、 过 期 等 都 会 导致 Cookie 的 变化 ， 而 Cookie 的 变化 会 影响 数据 的 准确 性 

* 即使 在 Cookie 不 变 的 条 件 下 ， 随 着 用 户 隐 私 和 安全 意识 的 提高 ， 禁 用 Cookie 也 会 导致 网 站 数据 采集 机 制 的 失效 。 
“ 多 终端 、 多 浏览 器 在 没有 登录 的 前 提 下 无 法 识别 并 关联 用 户 信 息 

* Cookie 中 IP 信 息 容易 受到 代理 方 的 影响 而 无 法 正确 定位 用 户 地 域 。 


* 网 站 数据 工作 只 能 追踪 线 上 的 数据 ， 而 对 于 线 下 的 数据 追踪 无 法 开展 ， 即 使 通过 数据 导入 进行 整合 ， 数 据 标 准 化 和 数据 集成 工作 的 准确 性 和 便捷 性 都 是 挑战 。 另外， 从 安全 性 、 时 效 性 、 功 能 性 等 方 
面 考虑 ， 网 站 数据 系统 不 适合 含有 大 量 线 下 数据 。 


. 恶劣 的 广告 环境 对 Cookie 信 息 的 干扰 无 法 排除 ， 这 些 “ 垃 圾 数据 ”已 经 极 大 的 影响 了 网 站 数据 工作 结果 的 准确 性 


这 些 因 素 导 至 了 网 站 数据 不 准确 、 多 系统 数据 不 一 致 、 数 据 孤立 、 数 据 缺 失 等 问题 。 基 于 如 此 多 “问题 数据 ”基础 上 的 结论 ， 其 可 信和 度 有 几 分 ? 芍 怕 真 的 只 能 作为 “参考 ”罢了 。 


B.2 ”网 站 数据 工作 的 发 展 方向 
对 于 网 站 数据 工作 的 发 展 ， 未 来 有 三 个 方向 需要 大 家 重点 关注 。 
1. 整 合 化 
(1) 线 上 的 用 户 数据 整合 
网 站 分 析 工 具 是 基于 用 户 的 研究 工具 ， 所 有 关于 用 户 的 信息 都 可 以 被 整合 并 应 用 到 用 户 分 析 的 过 程 中 。 用 户 数据 的 整合 包括 以 下 四 个 阶段 。 
` VRM: 访问 管理 系统 ， 这 也 是 当前 网 站 分 析 工 具 实现 的 阶段 ， 通 过 对 每 次 访问 的 分 析 来 实现 用 户 价值 的 研究 。 


` URM: 访客 管理 系统 ， 从 访客 的 角度 去 分 析 用 户 匿名 状态 下 生命 周期 的 完整 属性 和 价值 ， 具 备 更 全 面 的 用 户 认 知 视角 。 


* CRM: 用 户 管理 系统 或 客户 管理 系统 ， 从 真实 用 户 的 角度 分 析 完 整 生命 周期 内 的 所 有 数据 ， 可 以 通过 任意 维度 、 粒 度 做 数据 切 分 


. SCRM: 超级 用 户 管理 系统 ， 将 VRM、URM、CRM 三 个 系统 的 数据 打通 并 集成 到 一 起 (通常 是 线 下 企业 的 内 部 环境 ) ， 形 成 全 部 的 用 户 数据 ， 其 覆盖 用 户 从 站 外 来 源 渠道 、 网 站 访问 行为 、 线 下 行为 


属性 的 完整 价值 链 。 
(2) 企业 数据 整合 


仅 有 用 户 的 数据 还 不 够 ， 因 为 这 只 是 企业 众多 主题 的 一 个 而 已 。 企 业内 除了 用 户主 题 还 包括 商品 主题 、 仓 储 主题 、 物 流 主题 等 ， 要 将 这 些 主题 信息 完全 打通 并 整合 才能 形成 企业 内 部 完整 的 数据 链 ， 并 
且 这 些 数 据 从 任何 一 个 维度 进入 都 能 关联 其 所 有 的 流程 信息 ， 这 样 才能 起 到 “ 牵 一 发 而 动 全 身 ” 的 工作 效果 ， 并 将 数据 与 企业 运营 完全 结合 


2. 智 能 化 


智能 化 是 数据 工作 和 价值 产 出 的 重要 方向 。 当 前 数据 主要 的 智能 化 应 用 也 仪 仪 停留 在 预警 和 预测 应 用 上 ， 未 来 的 网 站 数据 工作 可 以 通过 以 下 三 个 阶段 提升 数据 智能 化 。 


自动 EDM、 桌面 提醒 等 。 为 了 实现 数据 的 


息 以 及 所 谓 的 “社会 意识 ”， 如 果 可 


Ps 


任意 指标 、 任 意 时 间 范 围 ， 并 通过 可 接触 方式 进行 业务 落地 。 例 如 ， 笨 
现价 


机 器 从 事 数据 工作 的 最 大 次 端 在 于 缺少 人 类 社会 背景 
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尽兴 


* 几 
口 


换 ， 未 来 数据 可 视 化 可 能 会 
企业 通过 购买 或 开发 更 高 级 的 工具 (如 水 晶 易 表 ) 已 经 实现 动态 交互 式 的 可 视 化 。 动 态 交 互 的 数据 可 视 
实现 娄 


上 企 


. 初级 阶段 : 通过 设 定 阅 值 进行 数据 智能 化 工作 ， 阅 值 的 设 定 支持 任意 维度 、 
直接 驱动 价值 ， 还 可 以 将 数据 智能 条 件 控制 与 业务 系统 集成 ， 直 接 完成 数据 端 到 用 户 端的 智能 应 用 。 
中 级 阶段 ; 该 阶段 的 数据 工作 方式 是 人 工 确定 业务 问题 并 人 工 开展 数据 研究 工作 ， 所 以 中 级 阶段 需要 能 够 在 人 工 指定 业务 问题 的 基础 上 让 数据 自动 开展 研究 工作 。 当 前 的 机 器 学 习 、 图 像 识 别 、 文 本 


集 
自然 语言 处 理 等 都 是 这 一 阶段 的 实现 要 素 ， 但 现 有 的 这 些 要 素 都 仍 处 在 萌芽 期 ， 还 需要 人 工 进 行 训练 、 调 优 或 指定 规则 才能 帮助 机 器 实现 价值 发 现 。 
以 把 “社会 意识 ”用 数据 的 方式 记录 下 来 ， 那 么 通过 机 器 的 自我 学 习 和 进步 ， 一 定 会 形成 机 器 的 “自我 意识 ”和 “自我 社会 观 ”。 此 时 ， 机 器 便 可 以 自动 识别 并 处 理 任何 问题 ， 人 类 的 角色 则 侧重 于 机 器 管 
着 以 下 路 径 发 展 : 


挖 气 、 


高 级 阶段 : 当 数据 能 够 自动 识别 业务 问题 并 进行 数据 研究 时 ， 数 据 就 已 经 具备 了 类 似 于 人 类 的 
景 变 
电视 、 移 动 设备 等 终端 媒体 ， 这 意味 着 展示 数据 一 定 要 携带 某 种 设备 。 如 果 未 来 能 够 剥离 实现 数据 可 视 化 与 


3. 可 视 化 
随 着 企业 数据 容量 的 增加 ， 传 统 的 数据 可 视 化 方法 将 无 法 满足 于 数据 应 用 的 复杂 场 


理 和 社会 管理 。 
. 由 静态 到 动态 交互 的 可 视 化 。 大 多 数 企 业 的 可 视 化 报表 和 图 形 仍 停留 在 静态 展示 的 阶段 ， 有 


化 可 以 让 数据 对 象 更 好 的 理解 数据 ， 同 时 也 能 通过 交互 的 手段 挖掘 更 多 维度 之 间 的 关系 。 
“ 由 平面 到 立体 的 可 视 化 。 当 前 的 数据 可 视 化 都 是 通过 平面 进行 展示 的 ， 这 直接 限制 了 三 维 或 三 维 以 上 数据 的 有 效 表 现 和 人 们 对 其 的 理解 。 未 来 ， 借 助 于 立体 投影 或 其 他 高 科技 ， 在 结合 动态 交互 的 基 
得 更 加 有 价值 。 


“ 由 依存 于 设备 到 脱离 设备 的 可 视 化 。 可 视 化 数据 表现 都 离 不 开设 备 ， 例 如 计算 机 、 投 影 


础 上 可 实现 立体 空间 内 的 数据 表达 。 
设备 之 间 的 依赖 关系 ， 那 么 将 能 实现 随时 随地 的 数据 可 视 化 ， 数 据 工作 也 会 


